17日、記者は2025年のデータセキュリティ開発会議から、私の国がデータファクター業界チェーンの多くの上流および下流の企業を育成し、拡大することを学びました。 2030年までに、私の国のデータ産業の規模は7.5兆元に達すると推定されています。
公開データのオープン共有
大規模な「睡眠データ」をアクティブ化します
生産要因にデータを含める世界初の国として、私の国は最初に完全なデータ産業チェーンを構築しました。データによると、2024年の私の年間のデータ生産は、前年比25%増加した41.06ゼットバイトに達したことが示されています。
現在、私の国のデータ分野には190,000を超える関連企業があり、データ業界の規模は2兆元を超えています。 20%以上の年間成長率に基づいて、私の国のデータ産業の規模は2030年に7.5兆元に達します。 alt = ""/>
国立データ管理局長liu liehong:現在、私たちは水平に接続され、垂直に接続され、調整されたデータインフラストラクチャシステムを構築し、基本的に2029年までに国家データインフラストラクチャの主要構造を構築することを計画しています。 src = "http://www.china-news-online.com/pic/2025-05-18/pudzsghxmjk.jpg" alt = "//
公開データのオープン共有は、データ要素の市場化において重要なブレークスルーとなっています。 2024年には、全国の地方自治体レベル以上の地元のパブリックデータのオープンプラットフォームの数が7.5%増加し、オープンデータの数が7.1%増加し、高品質のデータセットの数が前年比27.4%増加しました。
データ要素と業界の統合に関して、国は公開データ共有に対する開放障壁を加速し、公開データとエンタープライズデータの深い統合を促進し、大規模な「睡眠データ」をアクティブにしています。
高品質のデータセットの構築
人工知能の開発を加速
現在、データは従来の生産要因を超えており、人工知能技術と産業変換のブレークスルーの中心的な原動力となっています。高品質のデータセットは、人工知能モデルのパフォーマンスの飛躍の基礎であるだけでなく、工業チェーン全体を技術研究開発から商業的実装に変えます。では、高品質のデータセットはどのように構築されていますか?
ZhijiangのWenzhouでは、データ要素の国家市場指向の改革の「テストフィールド」として、データセキュリティとコンプライアンスシステムがここに構築され、データ要素の大規模な流れが確保され、データ取引エコシステムを形成し、より多くのデータを「ライブ」します。
本、論文、研究報告が使用されています。将来的には、画像、ビデオ、さまざまなセンサーなど、より多くの非テキストのものがまだ必要です。これらのデータは、大規模なモデル学習の重要なソースでもあります。
データアノテーションとクリーニングは、高品質のデータセットの構築における重要なリンクです。
データアノテーションは、「ラベル付け」を通じて「世界を知る」ように人工知能を教えます。非標識データは、文字化けした教科書のようなものであり、人工知能が効果的に学習することができないようになります。
データクリーニングは、複製を削除してエラーを修正することによりデータを浄化し、カオスデータは人工知能トレーニングの有効性に直接影響します。
私の国のデータラベル付け業界の出力値は80億元を超えています
2025データセキュリティ開発会議でリリースされた「2025高品質のデータセット調査レポート」は、人工知能と大規模なモデル技術の反復により、私の国のデータラベル付けの出力産業の出力が80億個のゼアであると、大規模なデータを超えていることを示しています。標準化された開発。
2024年、私の国で人工知能を開発または適用する企業の数は前年比36%増加し、高品質のデータセットの数は前年比27.4%増加し、人工知能のトレーニングとアプリケーションを強くサポートしています。大規模なモデルとデータアプリケーション企業を使用するデータテクノロジー企業は、それぞれ前年比57.21%および37.14%増加しました。
数億レベルに達しました。全国の7つのデータラベル付けベースの建設を促進し、医療、産業、教育などの分野で335の高品質のデータセットを構築し、1.7兆TBの合計マーキングスケールを構築し、121の国内大型モデルの研究開発をサポートします。
レポートは、私の国が現在高品質のデータセットの革新と開発を加速していることを示していますが、小規模データストックや低い出力、データセットの不均一な品質、主流の高価値データガイダンスの欠如、および低データ利用効率などの問題に依然として問題に直面しています。
データソースの信頼性と完全性を確保します。データのプライバシーとセキュリティの保証を強化し、データセットのセキュリティ評価機能の構築を促進します。
(cctv記者Wang Shiyu、Zhang Wei、Tang Zhijian、Zhang Yan、Han Dong)
<! - Repaste.body.End-> - >