微軟公司剛剛宣佈了一項關於他家搜尋引擎BING的關鍵演算法 sptag,這個演算法可以快速的將搜尋結果返回給搜尋使用者₪▩✘₪•。
SPTAG (Space Partition Tree And Graph)意思是分散式近似最近鄰域搜尋(ANN)庫₪▩✘₪•。其是為規模龐大的向量搜尋提供索引╃▩╃,搜尋和分散式線上服務₪▩✘₪•。利用它可以作為開源python庫的核心╃▩╃,這樣bing可以高速的再幾毫秒內搜尋出數十億的結果資訊₪▩✘₪•。
微軟公司表示SPTAG庫迄今為止已經對超過1500億條資料進行了編目╃▩╃,包括單個單詞••、字元••、網頁程式碼段和完整查詢₪▩✘₪•。
每天BING處理數十億個文件╃▩╃,目前的想法是將這些條目表示為向量╃▩╃,並搜尋這個1000億以上向量的巨大索引╃▩╃,以便在數毫秒內找到最相關的滿意結果”₪▩✘₪•。
Bing開發團隊希望開源SPTAG可應用於構建可識別基於音訊片段所說語言上或應用於讓使用者拍攝植物照片並識別出屬性和物種的服務₪▩✘₪•。
SPTAG庫現在已經開放使用╃▩╃,並且可提供構建和搜尋這些分散式向量索引的所有工具₪▩✘₪•。
宜昌網站製作
