耐心細致洗數據、模型訓練數百次、調試參數到深夜,這是人工智能訓練師的工作常態,也是這一“新職業”的工匠精神所在。
從在校的專業理論學習,到參與校企合作項目、校內人工智能工作坊深度實踐,再到勇于探索音頻領域現實應用、獨立創業……寧波聲韻信息技術有限公司創始人、好博體育官方剛從寧波職業技術大學(以下簡稱“寧職大”)人工智能技術應用專業畢業半年多的00后創業者張哲屹看似年輕,但已是人工智能訓練師領域的“老手”。
張哲屹認為:“人工智能不是高大上的理論,是需要像工匠一樣,在枯燥的數據海洋中通過千萬次的訓練,去打磨出一個可用的模型。”
“十四五”期間,人力資源和社會保障部累計發布72個新職業,其中就涵蓋“人工智能訓練師”“智能制造工程技術人員”“虛擬現實工程技術人員”等新職業。
當前,人工智能賦能千行百業,創造出了更多細分的新崗位。“人工智能訓練師”到底學什么?又有怎樣的就業方向和潛力?
張哲屹告訴中青報·中青網記者,“對于這一新職業,如果單指‘訓練師’,只進行模型的訓練和調試,是不對的。這只是整個流程中比較靠后的環節。”
“從預處理階段的數據清洗和處理,到數據指標設定和數據標注,再到算法設計、建模,最后才是對成熟模型進行訓練、調優。”寧職大人工智能技術應用專業主任曹瑛提到,“這些環節所需掌握的技能,學校都有對應的課程。”例如機器學習、人工智能數據服務、圖像處理技術、深度學習等,都是人工智能技術應用專業的核心課程,“均從最基礎的原理展開教學,幫助學生系統掌握神經網絡等關鍵技術的核心邏輯”。
“例如,要訓練同學視覺識別等方面技能的掌握情況,學校會設置‘工業零部件視覺檢測’項目。傳統的人工檢測方式,效率較低。”曹瑛說,在教學中使用來源于真實業務場景的案例,再分解成一個個小任務,去教會學生們整個流程所需的技能。
張哲屹就曾參加過學校與寧波鋼鐵有限公司合作的“鋼廠數據采集打標服務”等校企合作項目,在實踐中進一步鍛煉了其專業技術能力。
他還提到了學院的人工智能工作坊。“這里營造了一種近乎實戰的研發氛圍,是我從一名學生向‘人工智能訓練師’蛻變的關鍵期。”
以“數據標注員”這一細分崗位為例,張哲屹認為,正如有點調侃意味的“人工智能背后,有多少‘智能’就有多少‘人工’”之言,數據標注在他看來是很重要的一個崗位。“以圖片的視覺識別模型為例,‘標注’需要不斷訓練模型對圖片中部分區域的框定準確性,這是后續工作的基礎。一批‘標注’質量差的數據,對于模型訓練來說是毀滅性的。”他認為,“標注”的質量決定了整體模型的上限。
寧職大人工智能學院副院長何頌頌介紹,學校人工智能技術應用專業包括兩個方向:智能應用和工業視覺。“大一兩個學期都是專業基礎課,這兩個方向的課程設置是一樣的。但大二、大三會有專門的專業課和實踐課,智能應用方向有智能應用開發、大數據應用實戰等,工業視覺方向包含工業系統應用項目實戰、計算機視覺應用實戰等課程。”
南京信息職業技術學院(以下簡稱“南信院”)在高職院校中最早成立人工智能學院,該校人工智能學院院長何淼告訴中青報·中青網記者,自設立人工智能技術應用專業以來,學校始終緊跟技術發展的市場趨勢,更新專業培養方案。圍繞人工智能應用開發技術鏈前端數據崗位群、末端應用開發崗位群,形成人工智能學院的專業區分定位。
2024年,該校又率先新增了“人工智能數據工程技術專業”。何淼認為,“前期人工智能技術應用,更多是對傳統經典算法的使用。隨著人工智能技術不斷發展,我們發現‘算法再好,沒有好的數據還是不行’。未來人工智能賦能千行百業,都需要各個領域的高質量數據,這就催生出諸如‘人工智能數據工程師’等崗位。”因此,基于人工智能技術的數據基座邏輯,該院在專業設置方面已開始提前布局。
在剛結束不久的第五屆全國工業設計職業技能大賽決賽中,寧波職業技術大學人工智能技術應用專業大二學生留梓菡拿下了人工智能訓練師賽項學生組冠軍。
“這個比賽分考查理論和實操兩部分,有5個模塊,包括:智能家居搭建,數據信息處理,模型的調試和運用,智能體搭建,圖片生成、聲音克隆等智能模型的生成。選手需要在4個半小時內,完成所有模塊的任務,按點計分。”留梓菡說。
她提到,自己是在學校的人工智能工作坊中,獲取到一些校企合作項目和參與各種競賽的信息資源。
張哲屹曾參加過第二屆全國工業和信息化技術技能大賽,那是他第一次深刻體會到“人工智能訓練師”的含義。他記得,在老師們的指導下,“為了提升模型在特定工業場景下的識別精度,我們團隊反復進行了數百次的模型訓練與迭代。”有許多個夜晚,團隊成員一起盯著屏幕上的損失函數曲線,一行行地檢查預處理管線,一遍遍地調整超參數。
通常在大三時,同學們會去考“人工智能訓練師”這一證書。“學校人工智能技術應用專業2024屆學生共163人,162人拿到了這個證書。”寧職大人工智能學院教師李超煒介紹道。
早在2021年,人力資源和社會保障部就已發布《人工智能訓練師國家職業技能標準》,提出“人工智能訓練師是指使用智能訓練軟件,在人工智能產品實際使用過程中進行數據庫管理、算法參數設置、人機交互設計、性能測試跟蹤及其他輔助作業的人員”。
該新職業包含數據標注員、人工智能算法測試員兩個核心工種,共設五個等級,依次為初級工、中級工、高級工、技師和高級技師。李超煒表示,“學生的專業技能和考這個證書的技能是一致的,基本上都能拿下三級/高級工的證書。”
浙江工商職業技術學院人工智能學院副院長李福安告訴中青報·中青網記者,該校2025屆首屆人工智能技術應用專業畢業生,在“人工智能訓練師”高級工證書方面的下證率達到“全員通過”。李福安認為,這個證書在一定程度上能反映學生們的基本技能水平,有助于其求職就業。
隨著人工智能技術和產業迅速迭代升級,新的專業、職業正在迅速豐富。何淼表示,“可以預估,未來人工智能產業的崗位肯定呈體系化布局,中職、高職、本科都會有差異化定位的新職業出現。職業教育需要更加及時地調整相應的專業設置和更新技能人才培養的模式”。
他進一步補充道,光是前期的數據采集處理和測試、數據集開發等環節,就可能產生“人工智能數據服務員”“人工智能數據工程師”等崗位,未來甚至可能會有“人工智能數據集測試質檢員”“數據資產交易員”等更細分的崗位。“在《‘數據要素×’三年行動計劃(2024-2026年)》背景下,這些新職業都可能在數據市場化配置過程中應運而生。”
產教融合的培養體系之下,張哲屹敏銳地發現了音頻合成領域的痛點:市面上的相關資料稀缺,且落地產品很少。于是,畢業后,他創立了公司,專注于實時語音轉換服務。短短3個月,公司運營的平臺用戶已突破3萬人。并且,為了推動音頻領域AI的發展,張哲屹選擇開源數個核心訓練成果,讓更多開發者能在此基礎上繼續探索。
面對AI“新職業”的廣闊前景,學校面向當地產業和現實需要辦學,培養“直接能上手、入職就能干”的職業技能人才。
此前,寧職大啟動了第二批“海康機器人工業視覺訂單班”的招募。“2024年首批學生通過訂單班培養,已全部加入海康在寧波地區的核心經銷商體系,以工業視覺工程師身份負責客戶現場方案調試、設備運維及技術培訓工作,服務領域覆蓋汽車零部件檢測、智能倉儲分揀等新質生產力領域。”曹瑛說。
她強調,正是基于首批合作在人才輸送精準度、崗位適配性上的成功實踐,此次第二批訂單班在課程設置、實訓安排上進一步優化,將更精準對接海康產業鏈上下游的人才需求。
相比于人工智能相關專業的本科生、研究生,職業院校的同學畢業后直接進入大廠、車企、大型工業企業的難度比較大。“但是,我們為同學們規劃的職業路徑就是,先進入這些企業的下游集成商,在實際的AI應用場景中鍛煉解決問題的能力、提升技能。這樣經過幾年的工作經驗積累,同學們也有機會進入到上游、更高層次的一些企業中,或者自己成為獨立的集成商。”何頌頌坦言。
此外,寧波當地的制造業企業數量較多,許多公司正在進行智能化改造,需要相應的技術運維人員,“學生們去此類集成商企業,工作常態就是去各種行業的企業、工廠,為其搭建整體的智能化改造方案,并進行技術運維。”何頌頌說。這也是人工智能技術應用專業賦能、跨界的生動體現。
