谷歌旗下的基于人工智能的聊天機器人 Bard 在執(zhí)行邏輯和推理任務方面能力逐漸改進。這是根據(jù)谷歌今天發(fā)布的一篇博文所述,該博文表明,通過一種名為「隱式代碼執(zhí)行」的技術(shù),Bard 在數(shù)學和編碼等領(lǐng)域有了顯著改進。
正如博文所解釋的那樣,Bard 等大型語言模型本質(zhì)上是預測引擎。當給出一個提示時,它們通過預測下一個句子中可能出現(xiàn)的單詞來生成回答。這使得它們在撰寫電子郵件和文章方面非常出色,但在軟件開發(fā)方面卻有些容易出錯。
但是,你可能會問,GitHub 的 Copilot 和亞馬遜的 CodeWhisperer 之類的生成代碼模型呢?這些并非通用型。與 Bard 和 ChatGPT 等競爭對手不同,后者使用了來自網(wǎng)絡(luò)、電子書和其他資源的廣泛文本樣本進行訓練,Copilot、CodeWhisperer 和類似的生成代碼模型幾乎完全是在代碼樣本上進行訓練和調(diào)優(yōu)的。
為了解決通用型語言模型在編碼和數(shù)學方面的不足,谷歌開發(fā)了隱式代碼執(zhí)行,使 Bard 能夠編寫和執(zhí)行自己的代碼。最新版本的 Bard 會識別可能受益于邏輯代碼的提示,并在「幕后」編寫代碼、進行測試,并使用結(jié)果生成看似更準確的回答。
根據(jù)內(nèi)部基準測試,谷歌表示,與之前版本相比,新版 Bard 對「基于計算的」詞語和數(shù)學問題的回答提升了 30%。當然,我們還需要看這些聲明是否經(jīng)得起外部測試的考驗。
「盡管有了這些改進,Bard 并不總能做到完全正確,例如,Bard 可能不會生成幫助回答的代碼,它生成的代碼可能是錯誤的,或者 Bard 可能不會在回答中包含執(zhí)行的代碼,」Bard 產(chǎn)品負責人 Jack Krawczyk 和工程副總裁 Amarnag Subramanya 在博文中寫道?!副M管如此,這種改進的能力以結(jié)構(gòu)化、邏輯驅(qū)動的方式回應是使 Bard 變得更有幫助的重要一步?!?/p>
當谷歌今年早些時候推出 Bard 時,與 Bing Chat 和 ChatGPT 等相比,它并沒有表現(xiàn)得那么出色。事實上,推出過程出現(xiàn)了一些問題,谷歌的一則廣告中 Bard 給出了一個錯誤的答案,導致該公司股價短暫地下跌了 8%。
為了改善這些問題,谷歌引入了隱式代碼生成等其他改進措施,并增加了對新語言、多模式查詢和圖像生成的支持。然而,要想在該領(lǐng)域與領(lǐng)先的生成式人工智能聊天機器人保持競爭力,谷歌還需要進一步努力。
最近,Anthropic 推出了一款具有大幅擴展「上下文窗口」的人工智能聊天機器人模型,使其能夠相對連貫地進行長時間的對話。而開發(fā) ChatGPT 的 OpenAI 公司也開始支持插件,為 ChatGPT 增添外部知識和技能。
聲明:本網(wǎng)轉(zhuǎn)發(fā)此文章,旨在為讀者提供更多信息資訊,所涉內(nèi)容不構(gòu)成投資、消費建議。文章事實如有疑問,請與有關(guān)方核實,文章觀點非本網(wǎng)觀點,僅供讀者參考。

