在Square做了一年搜索的工程師想和你聊聊這些事
Square 是一家很神奇的技術(shù)驅(qū)動的公司。這個公司的文化很獨特,就工程師文化來說,早期 Square 在技術(shù)上還是比較大膽和激進的。
為什么這么說呢?舉幾個例子。雖然 Square 的核心產(chǎn)品是信用卡讀卡器,但 Square 嘗試開發(fā)過的產(chǎn)品真的很多,雖然不是每一個產(chǎn)品都長久地活了下來。比如電商平臺、電子錢包、Payroll 系統(tǒng),等等等等。另外 Square 早期有一批很 Nerdy 的技術(shù)人,包括 Rails 的 Contributor、Java Guice 的發(fā)明者等等。并且 Square 從不打怵使用新技術(shù),比如 ElasticSearch、Kafka 等,在版本還沒有穩(wěn)定的時候,Square 已經(jīng)在產(chǎn)品上使用了。而且因為我們是自己的 Data Center,沒有使用 Amazon。所有的配套服務(wù),包括 Deploy 以及 Production 的工具和環(huán)境,一套套系統(tǒng)全部都是 Build in House。以上種種,可能和我們創(chuàng)始人 Jack 本身是技術(shù)出身有一定的關(guān)系。
雖然說這些對于一個公司的發(fā)展不一定完全都是好事,但是對于工程師來說,卻是一個絕佳的成長環(huán)境。一來有機會接觸到新技術(shù)、或者技術(shù)的最前沿。二來因為不停的做新產(chǎn)品,所以早期的時候幾乎每個項目都是兩三個人從頭到尾完全自己搭建。
我在 Square 做過兩個大項目,一個就是和前 Google 員工 Ken 兩個人一起搭建了 Square 的搜索后端。另一個就是和 Eric 一起做了 Square Store 這個電商平臺,主要處理所有 Square 軟硬件銷售的支付流程。
雖然后來在支付這條路上走了下去,當(dāng)時一年左右做搜索的經(jīng)歷,還是蠻有意思的。所以想整理一下,分享給大家。當(dāng)然,一年的經(jīng)驗離資深還差得很遠,所以可能說的東西就入不了專家的法眼,因此本文稱為 “白話”。
基本概念
搜索說白了就是從已有的數(shù)據(jù)和信息里找到滿足用戶條件的一些匹配。
拿最簡單的數(shù)據(jù)庫來說,完成用戶對數(shù)據(jù)庫的搜索,不外乎這樣幾個概念:數(shù)據(jù)存儲格式,也就是 Table Schema;新數(shù)據(jù)的寫入;對 Table 的查詢;其中又包括 Indexing 來對部分查詢的 Pattern 進行性能上的優(yōu)化;另外可以根據(jù)某些 Column 的值對查詢結(jié)果進行排序。
搜索引擎從基本概念上來說,也是極類似的。例如常見的 Apache Solr 和 Elasticsearch(以下簡稱 ES),這兩者都是建立于 Lucene 之上的,且最核心的功能很類似。(Lucene 其實就是一個搜索引擎 Library,有一堆 Jar 文件,并提供一個 Lucene API 接口。)因為直接用 Lucene API 相對來說更靈活,但是需要更多的 Engineering Effort 才能使用,所以很多地方都是使用 Solr 或者 ES,兩者都是基于 Lucene 之上添加了很多可用 Feature 的一個封裝。
Indexing
Solr 和 ES 的 Schema 也可以看成定義數(shù)據(jù)的存儲格式和 Structure。這樣,當(dāng)你有新的數(shù)據(jù)需要存到你的可搜索數(shù)據(jù)集的時候,就需要把原始數(shù)據(jù)轉(zhuǎn)化為 Solr 和 ES 文檔定義的數(shù)據(jù)格式。這個過程通常稱為 Indexing,或者 ETL。ETL 是 Extract - Transform - Load 的簡稱。(責(zé)任編輯:方向)
- “掃一掃”關(guān)注融合網(wǎng)微信號
免責(zé)聲明:我方僅為合法的第三方企業(yè)注冊用戶所發(fā)布的內(nèi)容提供存儲空間,融合網(wǎng)不對其發(fā)布的內(nèi)容提供任何形式的保證:不保證內(nèi)容滿足您的要求,不保證融合網(wǎng)的服務(wù)不會中斷。因網(wǎng)絡(luò)狀況、通訊線路、第三方網(wǎng)站或管理部門的要求等任何原因而導(dǎo)致您不能正常使用融合網(wǎng),融合網(wǎng)不承擔(dān)任何法律責(zé)任。
第三方企業(yè)注冊用戶在融合網(wǎng)發(fā)布的內(nèi)容(包含但不限于融合網(wǎng)目前各產(chǎn)品功能里的內(nèi)容)僅表明其第三方企業(yè)注冊用戶的立場和觀點,并不代表融合網(wǎng)的立場或觀點。相關(guān)各方及作者發(fā)布此信息的目的在于傳播、分享更多信息,并不代表本網(wǎng)站的觀點和立場,更與本站立場無關(guān)。相關(guān)各方及作者在我方平臺上發(fā)表、發(fā)布的所有資料、言論等僅代表其作者個人觀點,與本網(wǎng)站立場無關(guān),不對您構(gòu)成任何投資、交易等方面的建議。用戶應(yīng)基于自己的獨立判斷,自行決定并承擔(dān)相應(yīng)風(fēng)險。
根據(jù)相關(guān)協(xié)議內(nèi)容,第三方企業(yè)注冊用戶已知悉自身作為內(nèi)容的發(fā)布者,需自行對所發(fā)表內(nèi)容(如,字體、圖片、文章內(nèi)容等)負責(zé),因所發(fā)表內(nèi)容(如,字體、圖片、文章內(nèi)容等)等所引發(fā)的一切糾紛均由該內(nèi)容的發(fā)布者(即,第三方企業(yè)注冊用戶)承擔(dān)全部法律及連帶責(zé)任。融合網(wǎng)不承擔(dān)任何法律及連帶責(zé)任。
第三方企業(yè)注冊用戶在融合網(wǎng)相關(guān)欄目上所發(fā)布的涉嫌侵犯他人知識產(chǎn)權(quán)或其他合法權(quán)益的內(nèi)容(如,字體、圖片、文章內(nèi)容等),經(jīng)相關(guān)版權(quán)方、權(quán)利方等提供初步證據(jù),融合網(wǎng)有權(quán)先行予以刪除,并保留移交司法機關(guān)查處的權(quán)利。參照相應(yīng)司法機關(guān)的查處結(jié)果,融合網(wǎng)對于第三方企業(yè)用戶所發(fā)布內(nèi)容的處置具有最終決定權(quán)。
個人或單位如認為第三方企業(yè)注冊用戶在融合網(wǎng)上發(fā)布的內(nèi)容(如,字體、圖片、文章內(nèi)容等)存在侵犯自身合法權(quán)益的,應(yīng)準(zhǔn)備好具有法律效應(yīng)的證明材料,及時與融合網(wǎng)取得聯(lián)系,以便融合網(wǎng)及時協(xié)調(diào)第三方企業(yè)注冊用戶并迅速做出相應(yīng)處理工作。
融合網(wǎng)聯(lián)系方式:(一)、電話:(010)57722280;(二)、電子郵箱:2029555353@qq.com dwrh@dwrh.net
對免責(zé)聲明的解釋、修改及更新權(quán)均屬于融合網(wǎng)所有。
您可能感興趣的文章
- 高速對照大數(shù)據(jù)技術(shù)對照1千萬國際通緝犯人臉照僅0.68秒
- 星傳媒體接管微軟巨額廣告預(yù)算
- 2011年1-7月份我國軟件業(yè)務(wù)收入情況
- 優(yōu)勢明顯-領(lǐng)跑行業(yè)
- 舊金山新稅收政策嚇跑Twitter和Zynga
- 2016年中國獨角獸:熱點與趨勢
- 當(dāng)當(dāng)網(wǎng)“價格戰(zhàn)”升溫 或與京東商城展開3C數(shù)碼戰(zhàn)
- 張亞勤:軟件外包上市企業(yè)市盈率比較合理
- 京東商城跟進價格戰(zhàn)圖書音像市場促銷反擊當(dāng)當(dāng)
- Verint推機器人流程自動化解決方案,助企業(yè)推升生產(chǎn)力與降低成本
新聞點評
- 煙臺市行政審批服務(wù)局打通梗阻持續(xù)推進交易全流程電子化
- 畢節(jié)市扶貧辦開展網(wǎng)絡(luò)安全應(yīng)急演練
- 一分錢坐公交?菏澤公交站亭再現(xiàn)掃碼騙局!
- 對國際人工智能與法協(xié)會副主席恩里科·弗朗西斯科尼的專訪
- 蘇滬軌道交通二維碼實現(xiàn)互聯(lián)互通
- 蘇州工業(yè)園區(qū)聚各方資源搶抓金融科技3.0發(fā)展機遇
- 網(wǎng)絡(luò)眾籌的另一面
- 烏海市紀委監(jiān)委運用“大數(shù)據(jù)”精準(zhǔn)監(jiān)督公車私用問題
- 學(xué)習(xí)類APP亂象仍屢禁不止
- F-One B輪融資圓滿落地,升級企業(yè)績效管理與分析服務(wù)
快速直達
新聞關(guān)注排行榜
熱門關(guān)鍵字
熱門圖片
- 中科院軟件研究所發(fā)布區(qū)塊鏈基礎(chǔ)組件RepChain
- 酷開系統(tǒng)7.0開啟視頻流時代,新技術(shù)加持下引領(lǐng)OTT行業(yè)新方向
- 2018版《中國企業(yè)服務(wù)云圖》震撼發(fā)布
- 王叁壽:打造新型智慧城市的數(shù)字引擎
- 靠創(chuàng)新重塑行業(yè)價值,創(chuàng)維引領(lǐng)電視行業(yè)生態(tài)化未來
- 湖北廣播電視臺獲IDC數(shù)字化大獎,新華三助行業(yè)客戶數(shù)字化轉(zhuǎn)型
- 科大訊飛智能辦公本亮相CCBN2019 AI黑科技助力廣電人
- MAXHUB在京發(fā)布萬眾矚目,或引會議平臺化時代巨變!
- F-One B輪融資圓滿落地,升級企業(yè)績效管理與分析服務(wù)
- 電子簽約市場規(guī)模2019有望增至30億元 上上簽成為行業(yè)佼佼者