ข่าววงจรปิด: ในวันที่ 17 พฤษภาคมนักข่าวได้เรียนรู้จากการประชุมการพัฒนาความปลอดภัยของข้อมูลปี 2568 ว่าประเทศของฉันจะปลูกฝังและขยายองค์กรต้นน้ำและดาวน์สตรีมจำนวนหนึ่งในห่วงโซ่อุตสาหกรรมปัจจัยข้อมูล คาดว่าภายในปี 2573 ระดับอุตสาหกรรมข้อมูลของประเทศของฉันจะสูงถึง 7.5 ล้านล้านหยวน
Liu Liehong ผู้อำนวยการฝ่ายบริหารข้อมูลแห่งชาติกล่าวว่าขณะนี้เขากำลังวางแผนที่จะสร้างระบบโครงสร้างพื้นฐานในแนวนอนแนวตั้งและประสานงานและแข็งแกร่ง src = "http://www.china-news-online.com/pic/2025-05-18/1kqbamcvbsw.png" alt = "" //
การแบ่งปันข้อมูลสาธารณะที่เปิดกว้างในตลาด ในปี 2567 จำนวนแพลตฟอร์มเปิดข้อมูลสาธารณะในท้องถิ่นที่หรือสูงกว่าระดับเทศบาลทั่วประเทศเพิ่มขึ้น 7.5%จำนวนข้อมูลเปิดเพิ่มขึ้น 7.1%และจำนวนชุดข้อมูลคุณภาพสูงเพิ่มขึ้น 27.4%เมื่อเทียบเป็นรายปี ในแง่ของการรวมองค์ประกอบข้อมูลและอุตสาหกรรมประเทศกำลังเร่งอุปสรรคการเปิดขึ้นเพื่อการแบ่งปันข้อมูลสาธารณะส่งเสริมการรวมข้อมูลสาธารณะและข้อมูลองค์กรอย่างลึกซึ้งและเปิดใช้งาน "ข้อมูลการนอนหลับ" ขนาดใหญ่
การสร้างชุดข้อมูลคุณภาพสูงเพื่อเร่งการพัฒนาปัญญาประดิษฐ์
ในปัจจุบันข้อมูลได้เกินกว่าปัจจัยการผลิตแบบดั้งเดิมและได้กลายเป็นแรงผลักดันหลักสำหรับการพัฒนาในเทคโนโลยีปัญญาประดิษฐ์และการเปลี่ยนแปลงอุตสาหกรรม ชุดข้อมูลคุณภาพสูงไม่เพียง แต่เป็นรากฐานที่สำคัญของการก้าวกระโดดในประสิทธิภาพของโมเดลปัญญาประดิษฐ์เท่านั้น ดังนั้นชุดข้อมูลคุณภาพสูงสร้างขึ้นได้อย่างไร?
บุคลากรด้านเทคนิคบอกกับผู้สื่อข่าวว่าการสร้างชุดข้อมูลแบบจำลองขนาดใหญ่ส่วนใหญ่มีการเชื่อมโยงหลักเช่นการรวบรวมข้อมูลการทำความสะอาดข้อมูลคำอธิบายประกอบข้อมูลและการประเมินคุณภาพ แต่ละลิงก์จะต้องดำเนินการวิจัยและพัฒนาและพัฒนาทางเทคนิคตามเป้าหมายตามลักษณะของขนาดใหญ่ความหลากหลายที่เพียงพอและคุณลักษณะแนวตั้งที่แข็งแกร่งของอุตสาหกรรม
คำอธิบายประกอบและการทำความสะอาดข้อมูลเป็นลิงค์สำคัญในการสร้างชุดข้อมูลคุณภาพสูง คำอธิบายประกอบข้อมูลสอนปัญญาประดิษฐ์ให้ "รับรู้โลก" โดย "การติดฉลาก" (เช่นการติดฉลาก "แมว" และ "สุนัข" สำหรับภาพถ่าย) ข้อมูลที่ไม่มีป้ายกำกับเป็นเหมือนตำราที่อ่านไม่ออกส่งผลให้ปัญญาประดิษฐ์ไม่สามารถเรียนรู้ได้อย่างมีประสิทธิภาพ การทำความสะอาดข้อมูลบริสุทธิ์ข้อมูลโดยการลบข้อผิดพลาดและการแก้ไขข้อผิดพลาดและข้อมูลที่วุ่นวายจะส่งผลโดยตรงต่อประสิทธิภาพของการฝึกอบรมปัญญาประดิษฐ์
ค่าเอาท์พุทของอุตสาหกรรมการติดฉลากข้อมูลของประเทศของฉันเกิน 8 พันล้าน
สามารถเห็นได้ว่าการติดฉลากข้อมูลเป็นลิงค์สำคัญในการสร้างชุดข้อมูลคุณภาพสูง ดังนั้นการพัฒนาอุตสาหกรรมที่เกี่ยวข้องกับประเทศของฉันคืออะไร? รายงานการวิจัยชุดข้อมูลคุณภาพสูง "2025 ที่เผยแพร่โดยการประชุมการพัฒนาความปลอดภัยของข้อมูลปี 2025 แสดงให้เห็นว่าด้วยการทำซ้ำของปัญญาประดิษฐ์และเทคโนโลยีโมเดลขนาดใหญ่ค่าเอาท์พุทของอุตสาหกรรมการติดฉลากข้อมูลของประเทศของฉันเกิน 8 พันล้านหยวนและการสร้างข้อมูลคุณภาพสูงได้เข้าสู่ขั้นตอนใหม่ของการพัฒนาขนาดใหญ่และมาตรฐาน