頭條搜索要想進(jìn)步需要學(xué)習(xí)谷歌,而不是對(duì)標(biāo)百度與360
發(fā)布日期:2021-04-30 訪問次數(shù):
今天看到一篇某媒體專訪頭條搜索負(fù)責(zé)人的文章。頭條搜索技術(shù)團(tuán)隊(duì)負(fù)責(zé)人在采訪里說了這么一句引起筆者的注意。
原話是這樣:
BERT是2018年時(shí)Google在NLP上的一個(gè)重要突破,2019年10月,Google宣布將BERT算法應(yīng)用到搜索引擎中,搜索結(jié)果得到了10%的提升。Google宣稱這是Google搜索引擎過去五年中最大、最正向的變化,而且也許是有史以來最大的變化。但Google并不是第一家將BERT應(yīng)用在搜索引擎里的,早在2019年初,頭條搜索就已經(jīng)將BERT在頭條搜索上全流量應(yīng)用,并且獲得了顯著的效果提升。上線得比Google更早,依靠的是大家大膽創(chuàng)新和快速迭代。
為什么筆者要把頭條這位負(fù)責(zé)人的話單獨(dú)拎出來,因?yàn)檫@里面的槽點(diǎn)真TM太多了,軟文跟宣傳是這樣玩的嗎?別人開源出來的技術(shù),您“彎道超車”現(xiàn)在反而把原研發(fā)者踩得一文不值?
看到這,不懂技術(shù)的讀者,看得會(huì)看的云里霧里的,不懂的人可能以為bert還是頭條研發(fā)出來的。筆者在這就給大家普及一下這里面的知識(shí)了。
什么是BERT?
BERT是一個(gè)預(yù)訓(xùn)練的語(yǔ)言表征模型,即我們基于大型文本語(yǔ)料庫(kù)(如維基百科)訓(xùn)練通用的“語(yǔ)言理解”模型,然后將模型用于下游的NLP任務(wù)(如問答)。BERT比之前的方法更優(yōu),因?yàn)樗堑谝粋€(gè)用于預(yù)訓(xùn)練NLP的無監(jiān)督、深度雙向系統(tǒng)。
2018年谷歌發(fā)表了一篇NLP論文引起了業(yè)界極大的關(guān)注與討論。接著,谷歌這2018年10月末官宣,將這套BERT開源。這就是BERT的來源。
那么,開源又是從哪里來的?
開源是一個(gè)自由的世界,任何一個(gè)開發(fā)者跟企業(yè)都可以加入或退出,自由地討論各種問題,發(fā)表各種建議。開發(fā)者可以自由地學(xué)習(xí)開源的代碼和技術(shù),用戶可以自由地使用開源產(chǎn)品。有了開放的代碼,在不違背開源代碼和產(chǎn)品的許可證的條件下,可以自由改寫、刪除、增加開源產(chǎn)品的功能。
了解了什么是開源,什么是BERT,我們?cè)倩乜唇袢疹^條的軟文。

你今日頭條基于谷歌的開源,然后全面“超越”谷歌。不但沒有對(duì)原開發(fā)者一點(diǎn)尊重,沒有人家google的開源,你頭條還沒得用呢,用了別人的東西,還要踩人一腳。跟人比快,這不是滑稽,而是天大的笑話!你頭條可以吹噓自己的工程能力和上線能力強(qiáng),但你對(duì)別人的開源如此的不尊重,也難怪國(guó)內(nèi)互聯(lián)網(wǎng)公司一直沒有核心技術(shù)了。

寫在最后:
稍微懂點(diǎn)技術(shù)的人都懂,國(guó)內(nèi)的互聯(lián)網(wǎng)公司跟所謂的研究機(jī)構(gòu)對(duì)于開源這事,僅限于免費(fèi)的代碼,有免費(fèi)的用,國(guó)內(nèi)的開發(fā)者們唯一需要做的就是“彎道超車”。當(dāng)然,你頭條“彎道超車”是你頭條的自由,但筆者在這要提醒你頭條的是,吃水不要忘了挖井人。
掃描添加好友
免費(fèi)提供:網(wǎng)站建設(shè)、網(wǎng)絡(luò)推廣解決方案
已幫助
人
人
您的鼓勵(lì)是站長(zhǎng)的最大動(dòng)力
標(biāo)簽:頭條搜索,今日頭條
轉(zhuǎn)載請(qǐng)注明來自:http://www.nbwmg.com/news/2135.html