大模型扎堆「趕考」，語(yǔ)文還是國(guó)產(chǎn)AI行，文言文能力超過(guò)95%考生|簡(jiǎn)訊

2023-06-09 01:52:03|

來(lái)源：量子位

打印

魚(yú)羊蕭簫發(fā)自凹非寺量子位|公眾號(hào)QbitAIChatGPT誕生后的第一場(chǎng)全國(guó)高考

魚(yú)羊蕭簫發(fā)自凹非寺

量子位 | 公眾號(hào) QbitAI

ChatGPT誕生后的第一場(chǎng)全國(guó)高考，考生忙，大模型們也很忙。

(資料圖片)

這不，高考還沒(méi)結(jié)束，AI挑戰(zhàn)高考題就成了刷屏熱搜話(huà)題，各家大模型都被拉出來(lái)寫(xiě)起了高考作文，甚至是參與整場(chǎng)考試。

（不知是不是巧合，Bard還在下午數(shù)學(xué)高考后，緊急升級(jí)了一波數(shù)學(xué)推理能力……）

結(jié)果，竟然有大模型寫(xiě)的作文，把資深高中老師都騙過(guò)了！

就在考試當(dāng)天，百度搜索正在內(nèi)測(cè)的“AI伙伴”，現(xiàn)場(chǎng)直播挑戰(zhàn)了一套語(yǔ)文試題。

從“基礎(chǔ)題”文言文翻譯、閱讀填空、古詩(shī)詞賞析，到“拉分題”微寫(xiě)作和作文，AI伙伴全部上手做了一遍。

結(jié)果，當(dāng)9份“混進(jìn)”了AI伙伴作品的高考作文送到語(yǔ)文老師莊臨旭手上時(shí)，他完全沒(méi)發(fā)現(xiàn)有篇是AI寫(xiě)的：

我是真沒(méi)想到，AI還能寫(xiě)文言文作文。

緊接著，AI伙伴展現(xiàn)的文言文理解能力，更是把資深老師嚇了一跳：

憑借我的教學(xué)經(jīng)驗(yàn)來(lái)看，超過(guò)95%的同學(xué)沒(méi)問(wèn)題。

一整場(chǎng)直播下來(lái)，就連圍觀了AI伙伴考試全程的畢導(dǎo)都感慨：

再來(lái)一次高考語(yǔ)文，我可能考不過(guò)它……

所以，集成了百度語(yǔ)義檢索技術(shù)+大模型能力于一身的AI伙伴，整場(chǎng)考試表現(xiàn)具體如何？

咱們一項(xiàng)一項(xiàng)展開(kāi)來(lái)看。

“AI考生”現(xiàn)場(chǎng)挑戰(zhàn)語(yǔ)文高考

先來(lái)看看大模型的“基礎(chǔ)題”——古詩(shī)詞賞析。

面對(duì)情感和寫(xiě)法的“找不同”問(wèn)題，百度搜索AI伙伴胸有成竹，不僅給出了明確的修辭手法，還進(jìn)一步分析了古詩(shī)的來(lái)歷和情感，屬實(shí)是閱讀理解十分到位了：

再到閱讀填空。面對(duì)文章解讀和“續(xù)寫(xiě)句子”能力，AI伙伴同樣毫不遜色：

那么，來(lái)看看大模型的“拉分題”寫(xiě)微作文，依舊沒(méi)什么問(wèn)題！

要是小作文體現(xiàn)不出來(lái)，再來(lái)看看AI伙伴作詩(shī)的能力。不僅現(xiàn)代詩(shī)手到擒來(lái)，甚至連藏頭詩(shī)都能搞定：

不過(guò)，要是再仔細(xì)一點(diǎn)搞搞提示詞工程，AI伙伴似乎就答得更好了。

以高考語(yǔ)文題目中的古詩(shī)詞理解為例，這里我們先在不給提示詞的情況下，把題目原樣“喂”給AI伙伴：

AI伙伴給出來(lái)的答案雖然也不錯(cuò)，但對(duì)于高考題目來(lái)說(shuō)，這答案著實(shí)有億點(diǎn)長(zhǎng)，也有點(diǎn)太仔細(xì)了：

接下來(lái)，給AI伙伴換上強(qiáng)調(diào)“最重要的三個(gè)意象”的提示詞。

果然，AI給出了更精準(zhǔn)的回答，指出包括病柏、丹鳳和鴟鸮在內(nèi)的三個(gè)意象，是最關(guān)鍵的：

但是，上述都還只是直播中展現(xiàn)出來(lái)的效果。像AI伙伴這類(lèi)有大模型加持的功能，其使用效果是否真的和提示詞工程強(qiáng)相關(guān)？

為了測(cè)測(cè)AI伙伴的“真正實(shí)力”，我們親自上手測(cè)了測(cè)它做高考題的效果。

直播中已經(jīng)做過(guò)了全國(guó)甲卷的作文題目，那么我們?cè)賮?lái)試試今年上海卷的作文。

第一輪，我們直接把題目甩過(guò)去：

看起來(lái)，AI伙伴雖然理解了文章“主旨”，但寫(xiě)出來(lái)還差點(diǎn)意思：論點(diǎn)不夠明確，作文的結(jié)構(gòu)也不太清晰。

第二輪，我們?cè)囍鴵Q了一下提示詞，給AI伙伴設(shè)置一個(gè)“角色扮演”效果。

首先，強(qiáng)調(diào)它是一名高考考生，然后給它“灌輸”一些高考作文的寫(xiě)作技巧：

這一輪，AI伙伴寫(xiě)得就有高考作文內(nèi)味了。

不僅給出了10字以?xún)?nèi)的標(biāo)題，還按照總分總、夾敘夾議的方式，很好地寫(xiě)出了一篇議論文：

看起來(lái)，挖掘大模型的潛力，很大程度上確實(shí)要依靠提示詞工程。

在直播中，百度集團(tuán)副總裁、搜索平臺(tái)負(fù)責(zé)人肖陽(yáng)還給我們列舉了一個(gè)非常簡(jiǎn)潔的提示詞公式：

提示詞 = 任務(wù) + 角色 + 上下文背景 + 細(xì)節(jié)補(bǔ)充。

有了它，不用再擔(dān)心大模型輸出和設(shè)想無(wú)關(guān)的答案了。

當(dāng)然，作為百度“用大模型重塑搜索能力”的終極殺器，AI伙伴能實(shí)現(xiàn)的功能，也遠(yuǎn)不止是做做高考題而已。

最早在2023萬(wàn)象·百度移動(dòng)生態(tài)大會(huì)上官宣發(fā)布的AI伙伴，目前已經(jīng)開(kāi)啟內(nèi)測(cè)，獲得試用資格后，可以直接從百度搜索界面進(jìn)入：

它的本職工作，更像是一個(gè)搜索引擎端的全能AI助理，不僅具有智能搜索能力，還兼具創(chuàng)作生成技藝：

一方面，AI伙伴相當(dāng)于一個(gè)對(duì)話(huà)版智能搜索工具。用它查資料，不需要再按關(guān)鍵詞搜索，直接“用人話(huà)”提問(wèn)就行：

不僅如此，每一句回答都有理有據(jù)，如果想要“追根溯源”，直接點(diǎn)鏈接就能跳轉(zhuǎn)到對(duì)應(yīng)的網(wǎng)站：

這樣一來(lái)，就不用擔(dān)心它會(huì)出現(xiàn)像ChatGPT整理文件那樣，出現(xiàn)“無(wú)中生有”一些案件的操作了。

另一方面，它又相當(dāng)于一個(gè)多模態(tài)大模型創(chuàng)作助手。

不僅可以幫助查資料、寫(xiě)周報(bào)、畫(huà)頭像，還能陪你模擬面試、甚至替你約會(huì)（？）。

這里我們借助AI伙伴的“程序猿小助手”，來(lái)試試生成一段代碼的能力。

以面試可能會(huì)考到的冒泡排序算法為例。

很快啊，幾乎沒(méi)有怎么思考，AI伙伴就給出了一段帶注釋的冒泡排序算法，最關(guān)鍵的是，它自己已經(jīng)運(yùn)行過(guò)，并成功輸出了一段結(jié)果！

這意味著我們不需要再自己去跑一遍這段代碼，而是能直接將它交給面試官了（doge）

從上面這些展現(xiàn)的能力來(lái)看，AI伙伴所能做到的，遠(yuǎn)非僅僅提供高考試題“參考答案”而已。

這次選擇用它挑戰(zhàn)高考題，大家伙可能看的是個(gè)新鮮勁兒，但“術(shù)”的表象之外，更值得關(guān)注的是“道”的變化：

使得AI伙伴能在高考題面前依舊“神采飛揚(yáng)”的大模型技術(shù)，正在以搜索引擎的代際變革為基點(diǎn)，席卷各行各業(yè)，甚至改變每個(gè)人的工作方式。

正如ChatGPT攪動(dòng)風(fēng)云之初，微軟CEO納德拉預(yù)測(cè)的那般：搜索正面臨巨變。

并且變化的不僅僅是搜索的技術(shù)、產(chǎn)品本身，這一次，更與每一個(gè)個(gè)體有了更緊密的關(guān)聯(lián)。

搜索三變

百度CEO李彥宏同樣認(rèn)為，“大模型即將改變世界”?；谶@樣的判斷，李彥宏2023年一季度OKR，便指向了“引領(lǐng)搜索體驗(yàn)的代際變革”。

現(xiàn)在，三個(gè)月過(guò)去，大模型究竟如何變革搜索，現(xiàn)在答案已經(jīng)越來(lái)越清晰。

從技術(shù)的角度出發(fā)，大語(yǔ)言模型的爆發(fā)，正在重新定義人機(jī)交互。

對(duì)于人類(lèi)而言，最自然的交流方式就是語(yǔ)言溝通。而大模型的代際突破，最直觀的一點(diǎn)體現(xiàn)，就是機(jī)器自然語(yǔ)言聆聽(tīng)和表達(dá)能力的飛速提升。

△回答來(lái)自百度搜索AI伙伴

搜索本身，就是一種人機(jī)交互的核心方式。其本質(zhì)的技術(shù)追求，就是要讓機(jī)器更高效地理解、推理、表達(dá)，化復(fù)雜問(wèn)題為直觀的第一條搜索結(jié)果。

因此可以說(shuō)，大語(yǔ)言模型的突破，正在全面激發(fā)搜索全新的潛能。

值得關(guān)注的一點(diǎn)是，伴隨著AI的發(fā)展，搜索始終都是最前沿AI技術(shù)最先落地的場(chǎng)景。

以百度搜索為例，圍繞“降低用戶(hù)表達(dá)需求門(mén)檻”、“降低用戶(hù)獲取內(nèi)容和服務(wù)的門(mén)檻”、“豐富搜索引擎的內(nèi)容供給”這三個(gè)目標(biāo)，百度搜索一直在AI技術(shù)上大量投入。

引入大模型之前，百度搜索已經(jīng)實(shí)現(xiàn)：

千億級(jí)全網(wǎng)索引；

全球領(lǐng)先的深度語(yǔ)義理解技術(shù)，相關(guān)成果曾獲2020年國(guó)家技術(shù)發(fā)明獎(jiǎng)二等獎(jiǎng)；

最大中文知識(shí)圖譜，覆蓋50億實(shí)體。

從產(chǎn)品的角度看，過(guò)去三個(gè)月，數(shù)據(jù)已經(jīng)證明，對(duì)話(huà)式搜索正在成為搜索引擎市場(chǎng)的一個(gè)新變量。

百度集團(tuán)副總裁、搜索平臺(tái)負(fù)責(zé)人肖陽(yáng)就透露，大模型加持下的AI伙伴，在內(nèi)測(cè)階段就已爆火，相關(guān)搜索問(wèn)答量激增。

這進(jìn)一步佐證大模型帶來(lái)的新人機(jī)交互方式，更能滿(mǎn)足人們對(duì)搜索“快速”、“有效”的訴求。

牽一發(fā)而動(dòng)全身，在現(xiàn)在這個(gè)時(shí)間節(jié)點(diǎn)，圍繞搜索的內(nèi)容生產(chǎn)和創(chuàng)作領(lǐng)域，創(chuàng)新模式也開(kāi)始逐漸顯現(xiàn)，并被積極地探索實(shí)踐。

同樣是在萬(wàn)象大會(huì)上，百度搜索還配合AI伙伴，推出了AI BOT解決方案。目的就是向內(nèi)容、服務(wù)生產(chǎn)者釋放大語(yǔ)言模型和AI技術(shù)能力，降低其與新搜索模式融合的門(mén)檻。

具體來(lái)說(shuō)，百度搜索提供了創(chuàng)作者、商家、機(jī)構(gòu)、服務(wù)和品牌等各類(lèi)型的AI BOT，讓他們能夠利用自身優(yōu)勢(shì)和獨(dú)特的內(nèi)容、知識(shí)、服務(wù)，創(chuàng)造虛擬分身，直接回答用戶(hù)的問(wèn)題。

在技術(shù)和產(chǎn)品之外，更與每個(gè)人息息相關(guān)的，是用戶(hù)搜索方式的改變。

正如前文所展示的，大模型時(shí)代，“提問(wèn)題”的能力正在變得越來(lái)越關(guān)鍵。

體現(xiàn)在現(xiàn)階段，就是提示詞寫(xiě)得好不好，會(huì)直接影響搜索生成結(jié)果的質(zhì)量。是否掌握提示詞工程能力，就像互聯(lián)網(wǎng)時(shí)代開(kāi)啟時(shí)，是否掌握搜索能力一樣關(guān)鍵。

對(duì)此，肖陽(yáng)提到了“搜商”的概念：

未來(lái)不僅要卷智商、情商，還要卷“搜商”。

更好地使用提示詞，更好地使用AI伙伴，獲得的優(yōu)勢(shì)會(huì)越來(lái)越大。

也就是說(shuō)，找到合適提示詞的能力越強(qiáng)，越能在大模型落地應(yīng)用的時(shí)代里，充分利用大模型的強(qiáng)大生產(chǎn)力。

可以說(shuō)，大模型刮起的時(shí)代風(fēng)暴之下，搜索三變，既是內(nèi)在技術(shù)瓶頸的代際突破，亦是外在人類(lèi)接觸信息方式的徹底變革。

無(wú)怪乎肖陽(yáng)作為技術(shù)變革的一線親歷者，會(huì)有這樣的判斷：

語(yǔ)義檢索技術(shù)與大語(yǔ)言模型結(jié)合，促進(jìn)搜索的理解、推理、組織和創(chuàng)作潛能進(jìn)一步釋放，有望在多方面催生顛覆式創(chuàng)新，促成搜索奇點(diǎn)降臨。

并且這一次，或許每一個(gè)人都會(huì)真真切切感受到這種代際變革帶來(lái)的影響。

One More Thing

說(shuō)起來(lái)，就在高考這兩天，AI加持下的百度搜索，忙的還不止有刷題這件事兒。

每年此時(shí)，百度都會(huì)啟動(dòng)專(zhuān)門(mén)的高考服務(wù)，通過(guò)搜索和AI核心技術(shù)，為考生和家長(zhǎng)提供便利。

今年，百度還基于AI技術(shù)，首次推出了高考搜索指數(shù)，涵蓋專(zhuān)業(yè)搜索熱度及變化趨勢(shì)、“院校PK”等信息?？忌议L(zhǎng)在擇校選專(zhuān)業(yè)的時(shí)候，可以更方面地參考對(duì)比。

AI志愿助手也進(jìn)行了重大升級(jí)，能更直觀地展示志愿預(yù)測(cè)結(jié)果，提供相關(guān)數(shù)據(jù)來(lái)輔助考生家長(zhǎng)做決策。

對(duì)了，利用高考搜索指數(shù)和其他高考相關(guān)搜索數(shù)據(jù)，百度還聯(lián)合中國(guó)教育在線掌上高考發(fā)布了不少有意思的數(shù)據(jù)：

高校方面，搜索熱度最高的本科院校里，南方高校霸榜雙一流和非雙一流大學(xué)前十。

專(zhuān)科院校中，山東是搜索職業(yè)教育最多的省份。

專(zhuān)業(yè)方面，醫(yī)學(xué)搜索熱度斷層第一，航空航天熱度攀升最快。

而最有“錢(qián)”景的，是船舶電子電氣工程……

關(guān)鍵詞：

責(zé)任編輯：hn1007

2021精品一区芒果-国产亚洲精品久久久久-国产真人性做爰视频免费40分钟-天堂网WWW最新版资源

大模型扎堆「趕考」，語(yǔ)文還是國(guó)產(chǎn)AI行，文言文能力超過(guò)95%考生|簡(jiǎn)訊

熱點(diǎn)推薦

全球今日訊！險(xiǎn)險(xiǎn)險(xiǎn)！瀏陽(yáng)消防從火場(chǎng)救出一

com接口是什么接口 com接口|環(huán)球快報(bào)

無(wú)道天之游俠（關(guān)于無(wú)道天之游俠的基本詳情

本色聯(lián)盟（關(guān)于本色聯(lián)盟的基本詳情介紹）

越跌越買(mǎi)！315億大舉抄底！港股ETF吸金居前

圖片新聞

杭州20條公交線試點(diǎn)公

找到特洛伊木馬養(yǎng)成

什么樣的心態(tài)才是長(zhǎng)壽

亞運(yùn)會(huì)配套保障項(xiàng)目

專(zhuān)題

大模型扎堆「趕考」，

長(zhǎng)安歐尚Z6智電iDD迅

我和我的傾城時(shí)光電視