日韩欧美在线观看中文,日本高清视频在线www色,风韵多水的老熟妇广场舞

首頁 > 快訊 >

知乎大模型「知海圖AI」上線！產(chǎn)品官宣即內(nèi)測，為4億用戶摘取「熱榜摘要」|環(huán)球熱消息

來源：富途牛牛發(fā)布時(shí)間：2023-04-14 16:08:37

來源：量子位作者：楊凈

又一家國內(nèi)企業(yè)大模型產(chǎn)品發(fā)布。

(資料圖片僅供參考)

不是別的，而是已擁有4億用戶的最大中文問答社區(qū)知乎。

而且官宣即內(nèi)測——

不光有首個(gè)大語言模型「知海圖AI」，首款產(chǎn)品也將應(yīng)用于熱榜。

情理之中，意料之外。

一方面，知乎擁有天然的大模型優(yōu)勢，有場景有應(yīng)用，最關(guān)鍵的還有天然大規(guī)模、高質(zhì)量的中文數(shù)據(jù)池。NewBing也將其視作中文數(shù)據(jù)源之一，一時(shí)間股價(jià)暴漲近50%。

這種優(yōu)勢放眼國內(nèi)并不多見，此次產(chǎn)品發(fā)布也算是千呼萬喚始出來。

但另一方面，在眾多尤其科研工作者認(rèn)知中，知乎作為知識問答分享平臺，每一次技術(shù)革命爆發(fā)都在這里圍觀與見證。

正如ChatGPT相關(guān)話題就已打破當(dāng)年AlphaGo討論熱度，瀏覽量達(dá)4億，討論量近24萬。

至于知乎背后相關(guān)AI技術(shù)和布局，并不被大多數(shù)人所知。

現(xiàn)在，知乎主動(dòng)分享了一切。

而且隨著產(chǎn)品的發(fā)布，知乎在大語言模型上的布局也首次浮出水面。

知乎大模型產(chǎn)品官宣即內(nèi)測

在發(fā)布會現(xiàn)場，知乎也釋出了「熱榜摘要」的產(chǎn)品形態(tài)最新Demo，讓正在等待內(nèi)測的朋友們先來一睹為快~

可以看到的是，“看山”小助手會出現(xiàn)在熱榜的問題下方。

然后它會抓取那些優(yōu)質(zhì)問答的重要觀點(diǎn)，經(jīng)過AI算法整理、聚合、潤色后，將回答梗概展現(xiàn)給用戶。

這樣一來，看熱門問題的同時(shí)就能獲取關(guān)鍵信息，效率直接拉滿。

而這背后的大語言模型CPM-Bee，來自當(dāng)下飽受市場關(guān)注的清華系大模型創(chuàng)業(yè)公司面壁智能。

據(jù)知乎聯(lián)合創(chuàng)始人、CTO李大海介紹，CPM-Bee是目前視野范圍內(nèi)表現(xiàn)最好的中文大語言模型。

面壁智能聯(lián)合創(chuàng)始人兼CEO曾國洋，也給出了官方內(nèi)測表現(xiàn)：

內(nèi)容聚合場景下，在41個(gè)問題中，有28個(gè)問題表現(xiàn)持平。與GPT-4相比基本持平。

作為國內(nèi)最早開展相關(guān)研究和探索的公司之一，創(chuàng)始團(tuán)隊(duì)來自清華計(jì)算機(jī)系自然語言處理與社會人文計(jì)算實(shí)驗(yàn)室（THUNLP），劉知遠(yuǎn)、孫茂松、劉洋多位教授分別是他們的聯(lián)合創(chuàng)始人和顧問。因此在大模型學(xué)研轉(zhuǎn)化、開發(fā)落地等方面都有豐富的經(jīng)驗(yàn)。

產(chǎn)學(xué)研轉(zhuǎn)化這塊，團(tuán)隊(duì)曾最早提出由知識指導(dǎo)的預(yù)訓(xùn)練模型ERNIE，圍繞模型預(yù)訓(xùn)練、提升學(xué)習(xí)、參數(shù)高效微調(diào)等這些大模型熱門議題，他們也在國際頂會上發(fā)表了數(shù)十篇論文。

他們也曾開發(fā)開源多個(gè)大模型，比如：國內(nèi)首個(gè)中文大模型CPM-1、高效易用大模型CPM-2、可控持續(xù)大模型CPM-3……

除此之外，法律、生物醫(yī)學(xué)等垂直領(lǐng)域也開發(fā)了專有專用大模型。成立伊始，就與法律、汽車、家電、傳媒等行業(yè)龍頭客戶達(dá)成合作，以及完成近千萬種子輪融資。

而就在最近，面壁智能剛獲由知乎領(lǐng)投、智譜AI跟投的天使輪融資。據(jù)雙方消息，此次投資合作旨在實(shí)現(xiàn)雙方優(yōu)勢資源的價(jià)值共創(chuàng)，共同探索大規(guī)模語言模型的上層應(yīng)用。

由此看來，知乎大模型布局也浮出水面：投資大模型公司，共同打造大模型應(yīng)用。

據(jù)透露，與面壁智能之間屬于是深度融合的關(guān)系，每天都要見一面的那種。

接下來，在CPM-Bee基礎(chǔ)上，隨著更多的反饋和迭代，新模型有了更強(qiáng)的邏輯推理能力和更快的訓(xùn)練和推理速度之后，將逐步應(yīng)用到知乎更多場景中去。

比如創(chuàng)作、討論場、信息獲取等。

事實(shí)上這種路徑也并不陌生，正如微軟與OpenAI。微軟的產(chǎn)品矩陣完美貼合ChatGPT的落地場景，應(yīng)用的同時(shí)又能反哺迭代大模型的能力。于是乎，正是兩者技術(shù)與應(yīng)用的深度融合，才有了震撼全球的搜索引擎、生產(chǎn)力和生產(chǎn)生活的變革，讓企業(yè)、個(gè)人都能享受到AIGC帶來的潛力和可能。

隨之而來的問題是——

為什么走這樣一條路？

當(dāng)前國內(nèi)大模型的發(fā)展，已經(jīng)遠(yuǎn)不能用火熱來形容。這個(gè)被認(rèn)為是比以往任何變革都大十倍的機(jī)會，任何企業(yè)和機(jī)構(gòu)都不愿意輕易錯(cuò)過，這幾周接踵而至的新進(jìn)展就可見一斑。

不可否認(rèn)的是，知乎此時(shí)布局大模型，選擇了一條最適合自己的路——

用知乎CEO周源的話說，是AI時(shí)代新生產(chǎn)力的開發(fā)者、以及新場景的創(chuàng)建者。

個(gè)中緣由得從國內(nèi)大模型發(fā)展開始拆解。

首份《中國AIGC產(chǎn)業(yè)全景報(bào)告》顯示，國內(nèi)大模型發(fā)展大致可以分為三種路徑：基礎(chǔ)設(shè)施層、模型層以及應(yīng)用層。

其中，模型層成為當(dāng)前發(fā)展的關(guān)鍵卡口，在一定程度上限制了上下層級（基礎(chǔ)設(shè)施層、應(yīng)用層）的發(fā)展。

至于模型層發(fā)展好與不好，歸根結(jié)底，主要來自算力和數(shù)據(jù)這兩方面：算力是支撐背后大語言模型訓(xùn)練的硬件基礎(chǔ)，而數(shù)據(jù)則是直接影響模型能力強(qiáng)弱甚至生成質(zhì)量的關(guān)鍵。

尤其是中文數(shù)據(jù)這塊，一方面本質(zhì)原因，中文相對英文復(fù)雜，技術(shù)難度高；另一方面，國外英文數(shù)據(jù)集更豐富，且質(zhì)量較高。但國內(nèi)的中文語料并不完善，必要時(shí)還需要各家公司來清洗，耗費(fèi)人力財(cái)力。

而這恰好與知乎區(qū)別于其他平臺的獨(dú)特優(yōu)勢有關(guān)。

我們都知道，模型效果的好壞，既取決于數(shù)據(jù)的數(shù)量，也取決于質(zhì)量。這一點(diǎn)知乎似乎能做到兩者兼?zhèn)洹?/p>

在數(shù)量方面，2022第三季度財(cái)報(bào)顯示，知乎社區(qū)內(nèi)的內(nèi)容量已累計(jì)超5.79億條。2022年年度財(cái)報(bào)顯示，問答量已累計(jì)到了5.06億條，覆蓋超1000個(gè)垂直領(lǐng)域。

尤其在一些專業(yè)問題上，更是表現(xiàn)明顯。

知乎戰(zhàn)略副總裁、社區(qū)業(yè)務(wù)負(fù)責(zé)人張寧透露這樣一組關(guān)鍵數(shù)據(jù)：

站內(nèi)從事科研學(xué)習(xí)和工作的人群總數(shù)高達(dá)544萬人。僅科研互聯(lián)網(wǎng)領(lǐng)域，就日均圖文生產(chǎn)量兩萬多篇。

在數(shù)學(xué)、物理、天文、人工智能等多個(gè)領(lǐng)域的回答、文章和視頻數(shù)都超過了100萬篇。

而除了數(shù)量之外，數(shù)據(jù)的質(zhì)量也是尤為關(guān)鍵。

在ChatGPT發(fā)布之初，經(jīng)常會出現(xiàn)一些離譜、錯(cuò)誤的答案。「一本正經(jīng)地胡說八道」是ChatGPT留給大家的初印象。

這背后其實(shí)正是與訓(xùn)練數(shù)據(jù)的質(zhì)量有關(guān)，數(shù)據(jù)集中摻雜了諸多魚龍混雜的內(nèi)容。

而在知乎，諸多專業(yè)人士的探討、問答機(jī)制的篩選構(gòu)成了內(nèi)容數(shù)據(jù)的高質(zhì)量，甚至有的知乎內(nèi)容已經(jīng)直接成冊出書。

前段時(shí)間，NewBing剛出爐，諸多網(wǎng)友發(fā)現(xiàn)一些回答來源正是來自于知乎。

周源這樣拆分AI時(shí)代的生產(chǎn)力要素，主要分為三層：應(yīng)用場景、專有數(shù)據(jù)以及基礎(chǔ)模型。基于問答的討論場，是天然的應(yīng)用場景。這當(dāng)中不斷產(chǎn)生的內(nèi)容、關(guān)系和知識圖譜，則是獨(dú)一無二專有數(shù)據(jù)。

而以GPT為代表的基礎(chǔ)模型層在快速發(fā)展，再結(jié)合知乎的應(yīng)用場景和專有數(shù)據(jù)，可推動(dòng)大模型快速的應(yīng)用落地。與此同時(shí)知乎的專業(yè)場景，還能反哺大模型技術(shù)迭代。

事實(shí)上，李大海也透露，知乎也正在與各種類型的公司合作，利用自身獨(dú)特優(yōu)勢，助推國內(nèi)大模型的發(fā)展。

除了應(yīng)時(shí)之勢的考量，這背后也是回歸本質(zhì)順其自然的選擇。

在知乎發(fā)現(xiàn)大會上，周源再次談及知乎社區(qū)一直以來「獲得感」的內(nèi)容價(jià)值觀——

讓每個(gè)人更好的分享知識、經(jīng)驗(yàn)與見解，找到自己的解答。

他認(rèn)為，AI終將服務(wù)于人，賦能于人，是人類能力的擴(kuò)增。

于是具體到知乎這一場景下，人機(jī)共創(chuàng)就可以幫助創(chuàng)作者更好地發(fā)揮創(chuàng)造力、提高內(nèi)容創(chuàng)作的效率和質(zhì)量，從而讓更多用戶得到幫助、開闊眼界。

大模型浪潮下，諸多應(yīng)用場景被提及。知乎也作為新場景的創(chuàng)建者躬身入局，探索更多價(jià)值。

回顧以往每一次的技術(shù)變革更迭，國內(nèi)百萬從業(yè)者們通過問答、話題、圓桌、想法、專欄、直播等方式在這里學(xué)習(xí)與探討、回應(yīng)和激辯。

因此從某種程度上來說，知乎作為關(guān)鍵媒介，在國內(nèi)前沿科技發(fā)展進(jìn)程中起到了不容忽視的作用。

尤其在這場全球ChatGPT風(fēng)暴里，體會尤為明顯，相關(guān)話題瀏覽量達(dá)4億，討論量超23.9萬。

吳恩達(dá)老師在這里周更博客，呼吁大家理性看待這個(gè)浪潮；被王慧文收購、正處風(fēng)口浪尖的一流科技創(chuàng)始人袁進(jìn)輝在知乎中尋找著答案……

諸多ChatGPT衍生產(chǎn)品在這里首發(fā)誕生：北大團(tuán)隊(duì)推出的ChatExcel、首個(gè)公開對標(biāo)ChatGPT開源項(xiàng)目ChatRWKV 、以及首個(gè)國內(nèi)ChatGPT檢測器……背后的開發(fā)者們也現(xiàn)身回應(yīng)，親自解答網(wǎng)友的疑惑。

一群科研人員、創(chuàng)業(yè)者、從業(yè)者在這里匯集聯(lián)結(jié)，打破時(shí)間與空間的壁壘，第一時(shí)間探尋前沿動(dòng)向，進(jìn)而去推動(dòng)國內(nèi)前沿科技的發(fā)展。

只是現(xiàn)在及未來，知乎將利用自己積累的優(yōu)勢，以更顯性的方式為中國大模型的發(fā)展貢獻(xiàn)力量。

關(guān)鍵詞：

分享到：QQ空間新浪微博騰訊微博人人網(wǎng)微信

上一篇：

下一篇：