Elemen data dan industri semakin mempercepat integrasi. Skala industri data negara saya akan mencapai 7,5 triliun yuan pada tahun 2030

Cctv.com2025-05-18

CCTV News: Pada 17 Mei, reporter belajar dari Konferensi Pengembangan Keamanan Data 2025 bahwa negara saya akan mengolah dan memperluas sejumlah perusahaan hulu dan hilir dalam rantai industri faktor data. Diperkirakan pada tahun 2030, skala industri data negara saya akan mencapai 7,5 triliun yuan.

DATA DUNIA. Data menunjukkan bahwa pada tahun 2024, produksi data tahunan negara saya mencapai 41,06 zetes, peningkatan tahun-ke-tahun sebesar 25%. Hingga kini, ada lebih dari 190.000 perusahaan terkait di bidang data negara saya, dan skala industri data melebihi 2 triliun yuan. Berdasarkan tingkat pertumbuhan tahunan lebih dari 20%, skala industri data negara saya akan mencapai 7,5 triliun yuan pada tahun 2030.

Liu Liehong, director of the National Data Administration, said that he is currently planning to build a horizontal, vertical, and coordinated and strong data infrastructure system, and basically build the main structure of the national data infrastructure by 2029.

Pembagian data publik terbuka telah menjadi terobosan penting dalam pemasaran elemen data. Pada tahun 2024, jumlah platform terbuka publik lokal di atau di atas tingkat kota secara nasional meningkat sebesar 7,5%, jumlah data terbuka meningkat sebesar 7,1%, dan jumlah set data berkualitas tinggi meningkat sebesar 27,4%tahun-ke-tahun. Dalam hal integrasi elemen data dan industri, negara ini mempercepat hambatan pembukaan untuk berbagi data publik, mempromosikan integrasi data publik dan data perusahaan yang mendalam, dan mengaktifkan "data tidur" besar-besaran.

Membangun set data berkualitas tinggi untuk mempercepat pengembangan kecerdasan buatan

saat ini, data telah melampaui faktor produksi tradisional dan telah menjadi kekuatan pendorong inti untuk terobosan dalam teknologi kecerdasan buatan dan transformasi industri. Set data berkualitas tinggi tidak hanya landasan lompatan dalam kinerja model kecerdasan buatan, tetapi juga membentuk kembali seluruh rantai industri dari penelitian teknologi dan pengembangan hingga implementasi komersial. Jadi bagaimana set data berkualitas tinggi dibangun?

di wenzhou, ze "alt =" "" Elemen data, sistem keamanan data dan kepatuhan telah dibangun di sini untuk memastikan aliran besar elemen data, membentuk ekosistem perdagangan data, dan membuat lebih banyak data "langsung".

Personel teknis mengatakan kepada wartawan bahwa membangun set data model besar terutama mencakup tautan inti seperti pengumpulan data, pembersihan data, anotasi data, dan evaluasi kualitas. Setiap tautan perlu melakukan penelitian teknis yang ditargetkan dan pengembangan dan adaptasi berdasarkan karakteristik skala besar, keragaman yang cukup, dan atribut vertikal yang kuat dari industri.

Anotasi dan pembersihan data adalah tautan utama dalam konstruksi set data berkualitas tinggi. Anotasi data mengajarkan kecerdasan buatan untuk "menyatukan dunia" dengan "pelabelan" (seperti memberi label "kucing" dan "anjing" untuk foto). Data yang tidak berlabel seperti buku teks yang kacau, yang mengakibatkan ketidakmampuan kecerdasan buatan untuk belajar secara efektif; Pembersihan data memurnikan data dengan menghapus duplikat dan memperbaiki kesalahan, dan data kacau akan secara langsung mempengaruhi efektivitas pelatihan kecerdasan buatan.

Nilai output industri pelabelan data negara saya melebihi 8 miliar

Dapat dilihat bahwa pelabelan data adalah tautan utama dalam konstruksi set data berkualitas tinggi. Jadi apa perkembangan industri terkait negara saya? "2025 Laporan Penelitian Set Kualitas Tinggi" yang dirilis oleh 2025 Data Security Development Conference menunjukkan bahwa dengan iterasi kecerdasan buatan dan teknologi model skala besar, nilai output dari industri pelabelan data negara saya telah melebihi 8 miliar yuan, dan pembangunan data berkualitas tinggi telah memasuki tahap baru dari pengembangan skala besar dan terstandarisasi.

In 2024, the number of enterprises developing or applying artificial intelligence in my country increased by 36% tahun-ke-tahun, dan jumlah set data berkualitas tinggi meningkat 27,4% tahun-ke-tahun, sangat mendukung pelatihan dan aplikasi kecerdasan buatan. Perusahaan teknologi data yang menggunakan model besar dan perusahaan aplikasi data meningkat masing-masing sebesar 57,21% dan 37,14% tahun-ke-tahun.