• <li id="yeaqi"><button id="yeaqi"></button></li>
  • <fieldset id="yeaqi"></fieldset>
    <fieldset id="yeaqi"><table id="yeaqi"></table></fieldset>

    •  

      發展人工智能 廣東還要加點“料”|焦點關注
      發布時間:2023-05-26 09:35:00 文章來源:南方日報
      發展人工智能廣東還要加點“料”

      “當下,人工智能發展首先需要攻克的是數據量不足的問題。”日前舉行的2023大灣區科學論壇上,中國工程院院士、鵬城實驗室主任高文直言,雖然企業可通過公開渠道相對容易地購買數據,但“仍不解渴”。

      如果把發展人工智能比喻成烹飪,我們不僅在算力大模型這個動力端上差點“火候”,還要加點“料”,即數據。“人工智能的競爭,本質上是數據創造權、數據所有權的競爭。”香港科技大學(廣州)協理副校長熊輝說。

      廣東有著完備的制造業體系,多年來沉淀了海量的制造業數據。同時,作為數字經濟大省,廣東擁有的數據量也位居全國之首。如何借助人工智能技術挖點“好料”,做出數據的“好菜”,讓資源越用越多、越用越好,是廣東發展人工智能產業的重要課題。


      (相關資料圖)

      藍海待挖

      隨著ChatGPT的火爆,未來有可能會導致一部分人員的失業,但同時也會孕育出一批新職業。目前其中最吸人眼球的,就是被稱為“AI喂養員”的數據標注員。

      給AI喂數據成了專業工作。這也從側面反映出,在AI時代,數據擁有的重要價值。

      5月23日,國家互聯網信息辦公室發布的《數字中國發展報告(2022年)》顯示,2022年我國數據產量達8.1ZB,同比增長22.7%,全球占比達10.5%,位居世界第二。

      “海量的數據正在改變現有的商業模式。”大數據專家、科技作家涂子沛舉例說,微信每日步數成為保險公司保費定價參考,步數多的人保費可能更低。“數據會成為我們的通行語言,每一家企業都會變成數據公司。”

      對于工業大省廣東來說,其制造業體系豐富,沉淀了海量的制造業數據。這些貫穿在生產、設計、營銷等全鏈條的數據,在人工智能技術的加持下,正在為制造業發展注入更大動能、打開更大空間。

      用AI“提煉”數據,可以讓數據變成資本。近日,在廣州數據交易所,廣州首個公共數據運營產品“企業經營健康指數”順利完成交易。通過人工智能手段,用經營數據給企業畫像,以數據資產化作為新型融資方式,將破解中小企業融資難問題。截至當前,廣州數據交易所累計交易金額突破10億元。

      數據價值的不斷挖掘,也在反向催生如何獲取更多有用數據的市場需求。在深圳數據交易所,可信數據空間技術正式實現國產商業化落地,實現了“數據為我所用,但不一定為我所有”,直擊行業痛點。

      該技術通過人工智能隱私計算等方式,可實現消費電子產品、新能源鋰電池等生產全過程質量數據的可信共享,打消企業數據流通的顧慮。

      “該技術未來還可以進一步擴展到制造業、物流等泛工業行業,服務于企業研發、生產、銷售、供應、物流等全過程,提升產業鏈競爭力。”深圳數據交易所董事長李紅光說。

      在廣東數字政府研究院副院長傅建平看來,廣東擁有中國制造業全部31個國民經濟行業大類,其中15個大類的規模更是居全國之首。挖掘利用好海量的制造業數據,可以推動傳統制造業智能化升級,支撐構建虛擬產業集群,催生新產品、新模式、新業態,加快制造業與服務業深度融合,推動人工智能產業加快發展。

      仍不解渴

      豐富的數據,就如同待開采的金礦,但如何“掘金”仍是一個問題。

      “數據之于AI大模型就像原油之于汽車,汽車是無法直接使用原油的,原油要經過一系列復雜的煉化過程。”鵬城實驗室云腦使能研究所所長張偉說。

      同樣的,海量原始數據需要經過“煉化”構建成數據集,才能真正有效地提供給AI大模型訓練。

      “國內數據流通存在供給不足的問題,尤其是高質量數據不足,限制了國內AI大模型發展。”李紅光注意到,國內大模型語音聊天機器人在表達上,中文反饋結果往往不如英文準確,除了中文更難理解、搜索難度更大之外,一個關鍵因素是數據支撐不足。

      如何獲取量足、質優的數據,成為人工智能產業向前發展繞不開的問題。

      “數據分散在不同的地方,碎片化比較嚴重。同時,沒有經過整理的數據,存在字段缺失、信息不準等問題,影響了數據價值的發揮。”李紅光說。

      但是,如果數據類型太過豐富,也會進一步分散數據價值。興森科技PCB事業部(廣州)總經理杜子良說,除了文本等結構化數據,工廠還經常留存圖像、音頻、視頻等多樣的非結構化數據,處理起來更加困難。隨著業務擴張,這家企業在深圳、江蘇宜興等地新建了多個生產基地,這些生產基地之間也面臨數據資源高效共享、協同、流動的挑戰。

      “數據挖掘的痛點是‘孤島效應’突出,難點是數據利用和保護機制不健全。”琶洲實驗室戰略研究中心林韜杰博士說。

      在實踐過程中,還有許多企業仍未建立數據采集能力。樹根互聯聯合創始人、CEO賀東東舉例說,比如將機器等“啞設備”用傳感器連接,采集數據后還要傳輸和存儲、建模分析,才能將數據變成資產,“但這么做成本高昂”。

      釋放潛能

      “數據應該和廣東優勢產業尤其是制造業深度融合,才能最大限度激活要素潛力,并助力產業轉型升級。”傅建平建議,廣東可從盤活數據資源、挖掘數據價值、釋放數據潛能三個方向對數據要素進行突破。

      所謂“見多才能識廣”,AI的迭代同樣來自“見多識廣之后的沉淀和創造力”。數據的治理、算法的進步,需要大量結構化標注數據,并對模型進行訓練、調優。

      “過去很多企業的數據被白白浪費掉了,但現在通過傳感器即可采集和挖掘數據,再借助基于機器的人工智能算法,不斷優化生產和營銷。”賀東東說,數據已經成為智能決策的依據,未來也將取代傳統廠房、設備,成為企業最有價值的要素。

      如今,廣東正分門別類推動傳統產業轉型升級,并為此出臺了專門的轉型指引,“手把手”指導企業數字化轉型。

      今年4月,廣東省工信廳印發的《廣東省紡織服裝行業數字化轉型指引》和《廣東省家具行業企業數字化轉型指引》提出,推動大數據挖掘應用邁上新臺階。

      比如,在紡織服裝行業,充分挖掘廣州、深圳、上海等紡織服裝展會數據資源,為招展、招商、服務和制定行業政策提供支撐。

      在家具行業,加強與家具賣場、經銷商、電商平臺深度合作,用好用足各類平臺數據銀行,分析挖掘消費者群體畫像,孵化培育熱銷產品,打造具有特色和影響力的消費新品牌。

      賽迪顧問廣州分公司總經理賈紡紡認為,在此基礎上,還要大力培育一批同時掌握行業和技術知識的制造業數字化轉型領域復合型人才,滿足行業發展對高素質人才的迫切需求,以數字化轉型助力廣東傳統產業轉型升級,提高廣東制造業核心競爭力。

      需求和機遇往往伴隨著行業痛點誕生,不少企業已經“嗅”到了商機,開始借助廣東海量的數據資源,研發高質量挖掘數據的系統平臺。

      比如,數據標注企業云測數據,目前就在華南設有數據交付中心和數據采集基地。在智能駕駛、智能制造等場景中,其自主研發的數據標注平臺,可幫助企業快速獲取高質量數據,教會人工智能如何識別行人、車輛、交通標識等。

      “針對數據分析難的問題,通過AI大模型自動識別并建模分析,可幫助企業快速提煉數據價值。”就在上周,云從科技在廣州宣布“從容”大模型亮相。該公司戰略部總監馬磊說,大模型在制造業領域將大有“用武之地”。

      南方日報記者 郜小平 昌道勵 李赫

      關鍵詞:

      樂活HOT

      娛樂LOVE