□李群
近日,江蘇省數據局、省委網信辦等八部門聯合印發《江蘇省發展數據標注產業建設高質量數據集實施方案(2025—2027年)》(以下簡稱《方案》)。《方案》出臺,為江蘇數據標注產業的發展和高質量數據集建設繪制了一幅宏偉的藍圖。
數據標注產業,是通過對數據進行篩選、清洗、分類、注釋、標記和質量檢驗等一系列加工處理,將海量的原始數據轉化為可供人工智能模型學習和訓練的高質量數據集,從而讓機器能夠“讀懂”數據、“理解”數據,進而實現智能化的決策和應用。可以說,數據標注產業是人工智能產業發展的“幕后英雄”,重要性不言而喻。
國家發展改革委等部門早在2024年12月就印發了《關于促進數據標注產業高質量發展的實施意見》,明確提出到2027年,要實現數據標注產業專業化、智能化及科技創新能力顯著提升,產業規模大幅躍升,年均復合增長率超過20%等目標。這充分表明,數據標注產業已成為我國布局數字科技新賽道、構建產業國際競爭新優勢的關鍵領域之一。
在這樣的大背景下,江蘇積極響應國家號召,迅速行動起來,出臺了具有地方特色的《方案》,這無疑彰顯了江蘇在數字經濟領域的前瞻性眼光和勇于擔當的精神。江蘇擁有豐富的行業數據資源和多元的應用場景,為數據標注產業的發展提供了得天獨厚的條件。通過系統推進數據標注產業發展和高質量數據集建設工作,江蘇在人工智能發展的賽道上搶占先機,全面賦能經濟社會高質量發展。
為了實現這些目標,《方案》也提出了一系列切實可行的舉措。在加強數據資源供給方面,我們充分發揮自身優勢,進一步整合和開放各類數據資源,為數據標注企業提供充足的數據“原料”;在壯大數據標注產業方面,將加大對相關企業的扶持力度,鼓勵企業通過技術創新、模式創新等方式提升自身競爭力,推動產業規模化、標準化、集約化發展。在加快高質量數據集建設方面,我們將加強對數據集建設的規范和管理,提高數據集的質量和可用性,為人工智能模型的訓練提供更加優質的數據支持。
《方案》出臺,藍圖繪制,未來也可預見。一方面,數據標注產業的發展將帶動相關產業鏈的協同發展,如數據采集、數據存儲、數據分析等,從而形成一個完整的數字經濟產業生態系統。另一方面,高質量數據集的建設將為人工智能在各個領域的應用提供強大的支撐,推動人工智能技術與實體經濟的深度融合,助力江蘇在智能制造、智慧醫療、智能交通等領域實現創新發展,為經濟社會的高質量發展注入新的動力。
乘“數”而上,蓄勢向“新”。《方案》出臺,我們壓實責任抓落實,一定能夠在數據標注產業領域取得豐碩的成果,為全國數據標注產業的發展提供寶貴的經驗和借鑒,在人工智能發展的浪潮中勇立潮頭。
