Notizie CCTV: il 17 maggio, il giornalista ha appreso dalla conferenza sullo sviluppo della sicurezza dei dati del 2025 che il mio paese coltizzerà ed espanderà una serie di imprese a monte e a valle nella catena del settore dei fattori dati. Si stima che entro il 2030 la portata dell'industria dei dati del mio paese raggiungerà 7,5 trilioni di yuan.
come primo paese del mondo per includere i dati di produzione inizialmente costruita a dati completi nella catena di dati completi. I dati mostrano che nel 2024 la produzione annuale dei dati del mio paese ha raggiunto 41,06 zete, un aumento di un anno in anno del 25%. Fino ad ora, ci sono più di 190.000 società correlate nel campo dei dati del mio paese e la portata dell'industria dei dati supera i 2 trilioni di yuan. Sulla base del tasso di crescita annuale di oltre il 20%, la portata dell'industria dei dati del mio paese raggiungerà i 7,5 trilioni di yuan nel 2030.
Liu Liehong, direttore della National Data Administration, ha affermato che sta attualmente pianificando di costruire un sistema di infrastruttura di dati orizzontale, verticale e coordinata e forte e fondamentalmente costruire la struttura principale dell'infrastruttura dei dati nazionali entro il 2029.
La condivisione aperta dei dati pubblici è diventata un'importante svolta nella commercializzazione degli elementi dei dati. Nel 2024, il numero di piattaforme aperte di dati pubblici locali a livello municipale a livello nazionale è aumentato del 7,5%, il numero di dati aperti è aumentato del 7,1%e il numero di set di dati di alta qualità è aumentato del 27,4%su base annua. In termini di integrazione di elementi e industrie di dati, il paese sta accelerando le barriere di apertura alla condivisione dei dati pubblici, promuovendo la profonda integrazione dei dati pubblici e dei dati aziendali e attiva un enorme "dati di sonno".
Costruire set di dati di alta qualità per accelerare lo sviluppo dell'intelligenza artificiale
Al momento, i dati hanno superato i tradizionali fattori di produzione ed è diventato la forza trainante di base per le scoperte nella tecnologia dell'intelligenza artificiale e la trasformazione industriale. I set di dati di alta qualità non sono solo la pietra angolare del salto nelle prestazioni del modello di intelligenza artificiale, ma rimodellano anche l'intera catena industriale dalla ricerca tecnologica e dallo sviluppo all'implementazione commerciale. Quindi, come vengono creati set di dati di alta qualità?
in wenzhou, zheiang, per un merito a nazionale per La riforma degli elementi di dati, un sistema di sicurezza e conformità dei dati è stato creato qui per garantire il flusso su larga scala di elementi di dati, formare un ecosistema di trading di dati e rendere più "live".
Il personale tecnico ha detto ai giornalisti che la costruzione di set di dati di grandi dimensioni include principalmente collegamenti di base come raccolta di dati, pulizia dei dati, annotazione dei dati e valutazione della qualità. Ogni collegamento deve effettuare ricerche tecniche mirate, sviluppo e adattamento in base alle caratteristiche della diversità sufficiente, sufficiente e ai forti attributi verticali del settore.
L'annotazione e la pulizia dei dati sono collegamenti chiave nella costruzione di set di dati di alta qualità. L'annotazione dei dati insegna all'intelligenza artificiale a "cognizzare il mondo" mediante "etichettatura" (come l'etichettatura di "gatti" e "cani" per le foto). I dati senza etichetta sono come libri di testo confusi, con conseguente incapacità dell'intelligenza artificiale di apprendere in modo efficace; La pulizia dei dati purifica i dati rimuovendo i duplicati e correggendo gli errori e i dati caotici influenzeranno direttamente l'efficacia dell'addestramento dell'intelligenza artificiale.
Il valore di output del settore dell'etichettatura dei dati del mio paese supera gli 8 miliardi
Si può vedere che l'etichettatura dei dati è un collegamento chiave nella costruzione di set di dati di alta qualità. Allora qual è lo sviluppo delle industrie correlate del mio paese? Il "Rapporto di ricerca sul set di dati di alta qualità del 2025" pubblicato dalla conferenza sullo sviluppo della sicurezza dei dati del 2025 mostra che con l'iterazione dell'intelligenza artificiale e della tecnologia dei modelli su larga scala, il valore di produzione del settore dell'etichettatura dei dati del mio paese ha superato 8 miliardi di yuan e la costruzione di dati di alta qualità è entrata in una nuova fase di larga scala e sviluppo standardizzato.
The report shows that my country is currently accelerating the innovation and development of high-quality data sets, but it Affronta ancora problemi come piccoli titoli di dati, bassa produzione, qualità irregolare dei set di dati, mancanza di orientamento di dati di alto valore tradizionale e bassa efficienza di utilizzo dei dati.