【資料圖】
北京商報訊(記者 魏蔚)6月28日,北京商報記者獲悉,中國工業(yè)互聯(lián)網(wǎng)研究院(以下簡稱“工聯(lián)院”)針對人工智能大模型在中文工業(yè)領(lǐng)域的知識問答能力進(jìn)行系統(tǒng)性評測結(jié)果顯示,百度文心一言表現(xiàn)超過GPT3.5,綜合評價指數(shù)在國內(nèi)排名第一。工聯(lián)院本次評測選取了工業(yè)領(lǐng)域典型的八大行業(yè)。百度文心一言在電子設(shè)備、裝備、鋼鐵、采礦、電力、石化、建材七個行業(yè)均獲國內(nèi)第一。
本次工業(yè)知識問答測試主要分為客觀題與主觀題兩大類,總計超過1100個問題。主觀題主要考察四大維度:基礎(chǔ)能力、語句能力、概括能力和邏輯能力。評測結(jié)果顯示,GPT4表現(xiàn)最佳。國內(nèi)頭部大模型表現(xiàn)亮眼,整體與GPT3.5相當(dāng)。其中百度文心一言表現(xiàn)超過GPT3.5,在國內(nèi)大模型中排名第一。在客觀題環(huán)節(jié),評測結(jié)果顯示,GPT4與文心一言表現(xiàn)好于其他大模型。但評測結(jié)果也同時指出,大模型普遍準(zhǔn)確率有較大的提升空間。主觀題方面,國內(nèi)大模型的基礎(chǔ)能力、語句能力與GPT4接近,概括能力、邏輯能力與GPT4有一定差距。在大模型的自我認(rèn)知能力和污染問題分析能力上,GPT4相較于其他大模型表現(xiàn)出更好的能力。
(責(zé)任編輯:周文凱 )關(guān)鍵詞: