7月8日,由上海數(shù)據(jù)交易所、大數(shù)據(jù)流通與交易技術(shù)國家工程實驗室承辦的“大模型時代下的數(shù)據(jù)要素流通”主題論壇在上海舉行。
上海市經(jīng)濟和信息化委員會信息化推進處處長錢曉在致辭中表示,上海作為國家大數(shù)據(jù)綜合示范區(qū),始終致力于推動數(shù)據(jù)產(chǎn)業(yè)發(fā)展、數(shù)據(jù)要素市場培育、數(shù)字經(jīng)濟紅利釋放,2022年全市數(shù)據(jù)核心企業(yè)突破1200家,核心產(chǎn)業(yè)規(guī)模近3400億元;建設(shè)了上海數(shù)據(jù)交易所,累計掛牌數(shù)據(jù)產(chǎn)品超1300個,率先提出數(shù)商體系,數(shù)商新業(yè)態(tài)蓬勃興起,全國首個數(shù)據(jù)要素產(chǎn)業(yè)集聚區(qū)在張江啟動建設(shè)。
錢曉透露,未來,上海將繼續(xù)加強技術(shù)創(chuàng)新,形成行業(yè)領(lǐng)先的高質(zhì)量語料標(biāo)準(zhǔn)操作流程和技術(shù)規(guī)范;完善組織機制,形成包括圖書館、媒體、互聯(lián)網(wǎng)平臺、大數(shù)據(jù)企業(yè)等在內(nèi)的核心數(shù)據(jù)伙伴群;做好評估機制,加快構(gòu)建高質(zhì)量數(shù)據(jù)集的評價指標(biāo)體系。
(資料圖片僅供參考)
啟動語料數(shù)據(jù)生態(tài)創(chuàng)新合作伙伴計劃
語料庫建設(shè)是一件長期性、專業(yè)性的工作,需要遵循相應(yīng)的質(zhì)量標(biāo)準(zhǔn)和規(guī)范,并保持持續(xù)更新和擴充,以適應(yīng)大模型發(fā)展的新需求和新挑戰(zhàn)。
上海數(shù)交所作為全國數(shù)據(jù)要素市場核心樞紐,在助力大模型語料庫建設(shè)上具有天然的優(yōu)勢。上海數(shù)交所官網(wǎng)已經(jīng)于7月7日正式上線語料庫,累計掛牌近30個語料數(shù)據(jù)產(chǎn)品,包含文本、音頻、圖像等多模態(tài),覆蓋金融、交通運輸和醫(yī)療等領(lǐng)域。
為更好打造高質(zhì)量語料庫、圍繞語料數(shù)據(jù)共建數(shù)商生態(tài),上海數(shù)交所牽頭發(fā)起語料數(shù)據(jù)生態(tài)創(chuàng)新合作伙伴計劃,并在當(dāng)天攜手首批合作伙伴上海人工智能實驗室、商湯科技、中國知網(wǎng)、瀾舟科技、OpenKG、拓爾思(300229)、新致和蜜度正式啟動該計劃,積極引導(dǎo)不同行業(yè)、不同領(lǐng)域、具有一定規(guī)模的高質(zhì)量語料數(shù)據(jù)產(chǎn)品掛牌交易,推動人工智能大模型技術(shù)創(chuàng)新與應(yīng)用落地,進一步豐富語料庫多樣性,助力數(shù)據(jù)要素市場建設(shè)。
上海數(shù)交所總經(jīng)理湯奇峰表示,大模型建設(shè)中,語料庫是一個非常重要的方向,語料庫采購已經(jīng)在不少大模型企業(yè)成本中占據(jù)重要比重,上海數(shù)交所希望以市場配置的方式組織數(shù)據(jù)要素推動語料庫建設(shè)。
據(jù)透露,上海數(shù)交所建設(shè)語料庫主要考慮兩個維度,一是語料庫的質(zhì)量,另一個是語料庫的開放程度?!氨热缬械钠髽I(yè)具有海量高質(zhì)量數(shù)據(jù)資源,開放意愿度也很高,但需要組織大量社會第三方企業(yè)幫助組織相關(guān)的大模型訓(xùn)練,我們針對四類數(shù)據(jù)產(chǎn)品開發(fā)情況不同、實際需求不同的供方企業(yè)制定了差異化工作策略,著力打造語料數(shù)據(jù)生態(tài)?!?/p>
數(shù)據(jù)要素賦能行業(yè)數(shù)字化轉(zhuǎn)型
數(shù)據(jù)要素在人工智能大模型的發(fā)展中具有關(guān)鍵性的作用,決定了模型的訓(xùn)練質(zhì)量、性能表現(xiàn)和應(yīng)用領(lǐng)域的廣度與深度。
中國電子副總經(jīng)理陸志鵬認為,大模型技術(shù)實現(xiàn)高質(zhì)量發(fā)展,數(shù)據(jù)有效供給是關(guān)鍵,亟需建設(shè)安全可信的數(shù)據(jù)底座。當(dāng)前數(shù)據(jù)合規(guī)確權(quán)、計量估價、協(xié)調(diào)分配、安全隱私保護等核心難題需要破解。
大數(shù)據(jù)流通與交易技術(shù)國家工程實驗室常務(wù)副主任黃麗華表示,數(shù)據(jù)驅(qū)動三大變革,包括經(jīng)濟結(jié)構(gòu)、創(chuàng)新范式、企業(yè)模式。面向大模型,數(shù)據(jù)要素市場大有可為,多層次數(shù)據(jù)要素市場的建設(shè)將提供重要助力。多層次數(shù)據(jù)要素市場的建設(shè)需要有明確的數(shù)據(jù)需求應(yīng)用場景,數(shù)據(jù)要素產(chǎn)權(quán)制度可以提供重要支撐,合規(guī)安全機制提供保障,基于這樣的一個市場,數(shù)據(jù)產(chǎn)品低成本、大規(guī)??傻貌庞锌赡軐崿F(xiàn),才能更好地賦能商業(yè)高效應(yīng)用,促進數(shù)字化轉(zhuǎn)型。未來,顛覆性創(chuàng)新一定是基于數(shù)據(jù)+人工智能+行業(yè)專業(yè)知識發(fā)生的。
中國知網(wǎng)副總經(jīng)理張宏偉表示,數(shù)據(jù)是人工智能的基石,數(shù)據(jù)的質(zhì)量和數(shù)量最終決定人工智能水平高低,影響其安全性、可信性。知網(wǎng)擁有海量高質(zhì)量文本語料數(shù)據(jù),打造可融入行業(yè)生產(chǎn)系統(tǒng)的專業(yè)知識增強大模型,同時基于CNKI知識增強大模型,將全面升級現(xiàn)有產(chǎn)品服務(wù),推出AIGC檢測等新服務(wù),賦能知識密集型行業(yè)領(lǐng)域。
(責(zé)任編輯:劉暢 )關(guān)鍵詞: