中文字幕无码夊久人妻|国产另类在线欧美日韩|精品无码乱码AV片国产|91久久香蕉国产熟女线看|白嫩丰满大乳美女免费视频|久久久久人妻精品区一三寸|免费一看一级毛片少妇丰满2|精品无码国产一区二区三区51

您現(xiàn)在的位置:融合網(wǎng)首頁 > 工信 > 軟件 >

在Square做了一年搜索的工程師想和你聊聊這些事

來源:朱赟 作者:朱赟 責(zé)任編輯:方向 發(fā)表時間:2016-10-26 11:15 
核心提示:雖然說這些對于一個公司的發(fā)展不一定完全都是好事,但是對于工程師來說,卻是一個絕佳的成長環(huán)境。一來有機會接觸到新技術(shù)、或者技術(shù)的最前沿。二來因為不停的做新產(chǎn)品,所以早期的時候幾乎每個項目都是兩三個人從頭到尾完全自己搭建。

Square 是一家很神奇的技術(shù)驅(qū)動的公司。這個公司的文化很獨特,就工程師文化來說,早期 Square 在技術(shù)上還是比較大膽和激進的。

為什么這么說呢?舉幾個例子。雖然 Square 的核心產(chǎn)品是信用卡讀卡器,但 Square 嘗試開發(fā)過的產(chǎn)品真的很多,雖然不是每一個產(chǎn)品都長久地活了下來。比如電商平臺、電子錢包、Payroll 系統(tǒng),等等等等。另外 Square 早期有一批很 Nerdy 的技術(shù)人,包括 Rails 的 Contributor、Java Guice 的發(fā)明者等等。并且 Square 從不打怵使用新技術(shù),比如 ElasticSearch、Kafka 等,在版本還沒有穩(wěn)定的時候,Square 已經(jīng)在產(chǎn)品上使用了。而且因為我們是自己的 Data Center,沒有使用 Amazon。所有的配套服務(wù),包括 Deploy 以及 Production 的工具和環(huán)境,一套套系統(tǒng)全部都是 Build in House。以上種種,可能和我們創(chuàng)始人 Jack 本身是技術(shù)出身有一定的關(guān)系。

雖然說這些對于一個公司的發(fā)展不一定完全都是好事,但是對于工程師來說,卻是一個絕佳的成長環(huán)境。一來有機會接觸到新技術(shù)、或者技術(shù)的最前沿。二來因為不停的做新產(chǎn)品,所以早期的時候幾乎每個項目都是兩三個人從頭到尾完全自己搭建。

我在 Square 做過兩個大項目,一個就是和前 Google 員工 Ken 兩個人一起搭建了 Square 的搜索后端。另一個就是和 Eric 一起做了 Square Store 這個電商平臺,主要處理所有 Square 軟硬件銷售的支付流程。

雖然后來在支付這條路上走了下去,當(dāng)時一年左右做搜索的經(jīng)歷,還是蠻有意思的。所以想整理一下,分享給大家。當(dāng)然,一年的經(jīng)驗離資深還差得很遠,所以可能說的東西就入不了專家的法眼,因此本文稱為 “白話”。

基本概念

搜索說白了就是從已有的數(shù)據(jù)和信息里找到滿足用戶條件的一些匹配。

拿最簡單的數(shù)據(jù)庫來說,完成用戶對數(shù)據(jù)庫的搜索,不外乎這樣幾個概念:數(shù)據(jù)存儲格式,也就是 Table Schema;新數(shù)據(jù)的寫入;對 Table 的查詢;其中又包括 Indexing 來對部分查詢的 Pattern 進行性能上的優(yōu)化;另外可以根據(jù)某些 Column 的值對查詢結(jié)果進行排序。

搜索引擎從基本概念上來說,也是極類似的。例如常見的 Apache Solr 和 Elasticsearch(以下簡稱 ES),這兩者都是建立于 Lucene 之上的,且最核心的功能很類似。(Lucene 其實就是一個搜索引擎 Library,有一堆 Jar 文件,并提供一個 Lucene API 接口。)因為直接用 Lucene API 相對來說更靈活,但是需要更多的 Engineering Effort 才能使用,所以很多地方都是使用 Solr 或者 ES,兩者都是基于 Lucene 之上添加了很多可用 Feature 的一個封裝。

Indexing

Solr 和 ES 的 Schema 也可以看成定義數(shù)據(jù)的存儲格式和 Structure。這樣,當(dāng)你有新的數(shù)據(jù)需要存到你的可搜索數(shù)據(jù)集的時候,就需要把原始數(shù)據(jù)轉(zhuǎn)化為 Solr 和 ES 文檔定義的數(shù)據(jù)格式。這個過程通常稱為 Indexing,或者 ETL。ETL 是 Extract - Transform - Load 的簡稱。(責(zé)任編輯:方向)

  • “掃一掃”關(guān)注融合網(wǎng)微信號

免責(zé)聲明:我方僅為合法的第三方企業(yè)注冊用戶所發(fā)布的內(nèi)容提供存儲空間,融合網(wǎng)不對其發(fā)布的內(nèi)容提供任何形式的保證:不保證內(nèi)容滿足您的要求,不保證融合網(wǎng)的服務(wù)不會中斷。因網(wǎng)絡(luò)狀況、通訊線路、第三方網(wǎng)站或管理部門的要求等任何原因而導(dǎo)致您不能正常使用融合網(wǎng),融合網(wǎng)不承擔(dān)任何法律責(zé)任。

第三方企業(yè)注冊用戶在融合網(wǎng)發(fā)布的內(nèi)容(包含但不限于融合網(wǎng)目前各產(chǎn)品功能里的內(nèi)容)僅表明其第三方企業(yè)注冊用戶的立場和觀點,并不代表融合網(wǎng)的立場或觀點。相關(guān)各方及作者發(fā)布此信息的目的在于傳播、分享更多信息,并不代表本網(wǎng)站的觀點和立場,更與本站立場無關(guān)。相關(guān)各方及作者在我方平臺上發(fā)表、發(fā)布的所有資料、言論等僅代表其作者個人觀點,與本網(wǎng)站立場無關(guān),不對您構(gòu)成任何投資、交易等方面的建議。用戶應(yīng)基于自己的獨立判斷,自行決定并承擔(dān)相應(yīng)風(fēng)險。

根據(jù)相關(guān)協(xié)議內(nèi)容,第三方企業(yè)注冊用戶已知悉自身作為內(nèi)容的發(fā)布者,需自行對所發(fā)表內(nèi)容(如,字體、圖片、文章內(nèi)容等)負責(zé),因所發(fā)表內(nèi)容(如,字體、圖片、文章內(nèi)容等)等所引發(fā)的一切糾紛均由該內(nèi)容的發(fā)布者(即,第三方企業(yè)注冊用戶)承擔(dān)全部法律及連帶責(zé)任。融合網(wǎng)不承擔(dān)任何法律及連帶責(zé)任。

第三方企業(yè)注冊用戶在融合網(wǎng)相關(guān)欄目上所發(fā)布的涉嫌侵犯他人知識產(chǎn)權(quán)或其他合法權(quán)益的內(nèi)容(如,字體、圖片、文章內(nèi)容等),經(jīng)相關(guān)版權(quán)方、權(quán)利方等提供初步證據(jù),融合網(wǎng)有權(quán)先行予以刪除,并保留移交司法機關(guān)查處的權(quán)利。參照相應(yīng)司法機關(guān)的查處結(jié)果,融合網(wǎng)對于第三方企業(yè)用戶所發(fā)布內(nèi)容的處置具有最終決定權(quán)。

個人或單位如認為第三方企業(yè)注冊用戶在融合網(wǎng)上發(fā)布的內(nèi)容(如,字體、圖片、文章內(nèi)容等)存在侵犯自身合法權(quán)益的,應(yīng)準(zhǔn)備好具有法律效應(yīng)的證明材料,及時與融合網(wǎng)取得聯(lián)系,以便融合網(wǎng)及時協(xié)調(diào)第三方企業(yè)注冊用戶并迅速做出相應(yīng)處理工作。

融合網(wǎng)聯(lián)系方式:(一)、電話:(010)57722280;(二)、電子郵箱:2029555353@qq.com dwrh@dwrh.net

對免責(zé)聲明的解釋、修改及更新權(quán)均屬于融合網(wǎng)所有。

新聞關(guān)注排行榜

熱門推薦 最新推薦

熱門關(guān)鍵字

關(guān)于我們 - 融合文化 - 媒體報道 - 在線咨詢 - 網(wǎng)站地圖 - TAG標(biāo)簽 - 聯(lián)系我們
Copyright © 2010-2020 融合網(wǎng)|DWRH.net 版權(quán)所有 聯(lián)系郵箱:dwrh@dwrh.net 京公網(wǎng)安備 11011202002094號 京ICP備11014553號