服務熱線
13262752056
人工智能計量校準檢測未來可期
針對人工智能的計量校準,闡述了其緊迫性、必要性以及可行性。提出了2種不同的人工智能計量解決方案。其一為基礎方式,從智能的7個維度出發,分別進行語言智能、數理邏輯智能、空間智能、肢體運動智能、音 樂智能、人際關系智能、內省智能的計量校準研究,然后,針對同時含有兩種以上智能的多元智能系統,進行面向具體任務目標的綜合加權,給出面對具體任務目標的智能水平定量評價結果。其二為工程方式,從每一個具體而明確的人工智能系統入手,依據愿景目標確立評價指標體系,開展計量校準研究,*終以定量量化方式,評價系統的分項與綜合智能水平。其主導思想是以定量量化方式,評價任意智能系統的智能水平。
1概述
人工智能(AI,artificialintelligence)的思想,自從1956年在達特茅斯(Dartmouth)被麥卡賽(JohnMcCarthy)、明斯基(MarvinMinsky)、羅切斯特(Rochester)和香農(Shannon)等提出,經過60余年的發展變化,時至今日,已經形成為一個熱點和前沿方向的代名詞。
由此導致全世界的技術發展都在向智能化方向飛速挺進[1~11],智能機器人、智能翻譯機、智能身份識別、智能診斷、智能網絡、智能社區、智能制造、智能材料、智能武器、智能彈藥、智能戰士、智能飛機、智能機器、智能手表、智能交通、智能家電等等,幾乎人類生活的所有方面,都無處不在體現智能化發展和智能化趨勢。而且,在可以預見的將來,這種趨勢將繼續持續發展下去,并且更加深入持久地滲透和影響到人們的生產、生活的各個方面。
遠在20世紀70年代,人工智能就與空間技術、能源技術並稱為20世紀的3大尖端技術,進入新世紀后,人工智能又與納米科學、基因工程並稱為21世紀的3大尖端技術。各大工業化國家,為了搶占未來的科技制高點,在新一輪科技競爭中占得先機,紛紛投入重兵,開啟自身的有關方向的各類計劃與研究。
2018年4月16日,英國議會下屬的人工智能特別委員會發布《英國人工智能發展的計劃、能力與志向》(AIintheUK:Ready,willingandable?)報告[12],從其概念、設計、研發和其對工作、生活、醫療等領域的影響以及應對人工智能威脅、塑造人工智能未來等層面進行了系統闡述。
歐盟委員會發布了由人工智能高級專家組(AIHLEG)編制的《人工智能道德準則》(AIEthicsGuidelines)草案[13],指出AI的發展方向應該是「可信賴AI」,即確保這一技術的目的合乎道德,技術足夠穩健可靠,從而發揮其*大的優勢并將風險降到*低。旨在為AI系統的具體實施和操作提供指導。
2019年2月11日,美國總統Trump簽署了《美國人工智能倡議》(AmericanAIinitiative)行政令[14],將美國人工智能技術發展上升到了國家級戰略的高度。這份倡議有5大核心要點:一是重新定向資金,要求聯邦資助機構優先考慮人工智能投資;二是提供資源,為人工智能研究人員提供聯邦數據、計算機模型和計算資源;三是建立標準,要求美國國家標準與技術研究院制定標準,以促進“可靠、強大、安全、可移植和可交互操作的人工智能系統”的發展;四是建立人才隊伍,要求各機構優先考慮學徒、技能計劃和獎學金,為美國培育能夠研發和利用新型人工智能技術的研發人才;五是加強國際化參與,呼吁制定國際合作戰略,確保人工智能的開發符合美國的“價值觀和利益”。
為抓住人工智能發展的重大戰略機遇,構筑我國人工智能發展的先發優勢,加快建設創新型國家和世界科技強國,2017年7月20日,國務院印發了《新一代人工智能發展規劃》[15]。提出了面向2030年我國新一代人工智能發展的指導思想、戰略目標、重點任務和保障措施,為我國人工智能的進一步加速發展奠定了重要基礎。
2018年1月18日,我國國家標準化管理委員會在北京宣布成立國家人工智能標準化總體組和專家咨詢組,負責全面統籌規劃和協調管理我國人工智能標準化工作。
2019年3月4日,第十三屆全國人大二次會議舉行新聞發布會,已將與人工智能密切相關的立法項目列入立法規劃。2019年6月17日,國家新一代人工智能治理專業委員會發布《新一代人工智能治理原則——發展負責任的人工智能》[16],提出了人工智能治理的框架和行動指南。
在智能制造領域,德國首先提出了人工智能特色鮮明的工業4.0;相應地,美國提出了再工業化;中國也提出了中國制造2025,站在歷史的新高度,從全局戰略出發,明確我國實施制造強國戰略的*個十年的行動計劃,將高檔數控機床和機器人作為重點推動領域之一。日本韓國也都將機器人和人工智能列為國家重大戰略。
人工智能的意義、價值、重要性,由此可見一斑。這也表明,人工智能已經上升為國家戰略。相應地,人工智能的計量校準面臨重大行業需求。
與科技界、工業界等轟轟烈烈的人工智能運動相比,在計量測試行業一直沒有明顯的應對措施,人們所從事和所規劃的,仍然是幾何量、熱學、力學、電磁學、無線電電子學、時間頻率、光學、聲學、化學、電離輻射等10大傳統方向的物理量值計量校準,另外附加了有關生物量值、醫學量值等新興領域的量值計量,正在進行工作的展開和專業的深化。所有這些,目前都與人工智能相去甚遠?,F階段提及人工智能的計量,人們甚至都不知道該計量校準什么,以及用什么樣的量值和定義來衡量人工智能,更談不上如何實現這些量值的計量校準了。
然而,人工智能若被作為一門科學加以研究和發展,就需要探索其中的定義、范疇、領域、規律、規劃,并對其進行符合性量化、差異性評估。沒有計量手段介入,將無法細化和深化,很難進步和發展。若其被作為一種技術加以應用,其質量比較、完善程度、水平高低、效率高低、能力大小等,依然需要計量手段的衡量,以定量方式進行量化評估。如此才能給其應用提供指導、借鑒、參考和依據。
由此可見,不論是否艱難,以及距離當今的工作有多遙遠,人工智能的計量校準一直是一個典型的客觀需求。在未來的計量科學發展中,應該是主流方向之一。目前,還遠未達到這一地步,僅停留在功能展示、競技博弈、人機博弈等粗淺層面。例如:
1997年5月,IBM公司研制的深藍(DEEPBLUE)計算機人工智能系統戰勝了國際象棋大師卡斯帕洛夫(Kasparov)[17]。2016年以來,AlphaGo成為*個戰勝圍棋世界冠軍的人工智能機器人[18]。
2019年10月25至27日,中國智能機器人格斗大賽在杭州夢想小鎮舉辦[19],場面的熱烈與火爆,恰恰說明了計量校準的缺失。
本文后續內容,將主要討論人工智能的校準問題,試圖將計量校準理念引入人工智能的計量評價中,從而尋求技術解決方式。
2智能的有關闡述
智能,是智力和能力的總稱[20]。其中,“智”是指進行認識活動的某些心理特點;“能”則是指進行實踐活動的某些心理特點。可以認為,智是指認知世界的能力,而能是指改造世界的能力。
智能是一種多維度的范疇概念,哈佛大學的霍華德加德納(HowardGardner)的多元智能理論將其分為7個范疇:語言智能、數理邏輯智能、空間智能、肢體運動智能、音樂智能、人際關系智能、內省智能[21]。
其中,語言智能指能有效利用音(語言)、像(文字、手勢、動作、圖形)等表達自己的思想,并確切理解他人思想表述的能力,以及靈活掌握語音、語義、語法、語氣,具備語言思維、語言表達、語言欣賞,并靈活運用語言的能力。
數理邏輯智能指可有效計算、測量、推理、歸納、分類,并綜合運用的能力。其包括邏輯方式和關系、陳述和主張、功能及其它相關抽象概念的敏感性。
空間智能,指準確感知聽覺、嗅覺、觸覺、視覺空間及周圍事物,并能將感覺到的形象以三維空間坐標圖型方式表達出來的能力。其中包括對色彩、線條、形狀、形式、氣味、聲音等的空間關系的敏感能力。
運動智能,指善于用全部或局部身體表述思想和情感,以及靈活制作或操作物體的能力。包括平衡、協調、敏捷、力量、彈性、速度、觸覺等方面的能力。
音樂智能,指敏銳感知、識別和表達音調、旋律、節奏、音色及其變化的能力。該項智能強調的對節奏、音調、旋律或音色的敏感性,稱為音樂天賦,包括表演、創作及思考音樂的能力。
人際關系智能,指能良好理解他人并與之交往的能力。包括覺察他人情緒情感、體會他人感覺感受、辨別他人暗示、以及做出相應反應的能力。
內省智能也表現為自認知能力,包括自我認知和自然認知。自我認知是指有自知之明,并據此進行行為規范的能力。包括自身的長處和短處、愛好、情緒、意向、脾氣、自尊、獨立思考的能力。
自然認知是指對自然界中各種事物的觀察、體察、辨別、分類的能力。包括好奇心、求知欲、敏銳觀察力、體會細微差別的能力。
從上述有關智能的7個范疇來看,目前的計量校準工作中,僅僅在聲學計量的部分工作與語言智能有一些關聯,幾何量計量的工作與空間智能有一定關系。有關智能的計量校準,基本上呈現空白狀態。其根本原因,是智能從總體上說,仍然屬于潛在的能力,尚未形成任何實體或狀態。而計量校準則一直面對的是能夠看得見、摸得著、或感受得到的實體和狀態,對于未能形成任何實體狀態的潛在能力,無法使用計量校準手段進行直接計量評價。若想對其進行計量評價,則必須通過具體實體的變化,將其潛在的能力進行釋放,然后,根據潛在能力釋放的效果對其進行計量評價。
人工智能計量校準的工作之一,就應該是尋找出合適的各種狀態變化的標準,并將其施加給相應的人工智能系統,以其對于不同智能范疇的標準狀態變化的響應情況,定量評價其相應的智能水平。
3人工智能的發展
人工智能是研究開發用于模擬、延伸和擴展人的智能的理論、方法、技術及應用系統的一門新的技術科學,是計算機科學的一個分支。它試圖建造出一種能與人的智能相似的方式進行工作的機器。
典型的人工智能系統包括機器人系統、圖像識別系統、語言識別系統、自然語言處理系統和各類專家系統等。它是一門交叉學科,是自然科學與社會科學的交叉。所涉及的學科包括哲學、數學、認知科學、心理學、計算機科學、神經生理學、信息論、控制論、方法論等[22~25]。
人工智能的研究范疇包括知識的定義、自然感知、智能搜索、機器學習、知識的獲取、模式識別、知識的分類、知識的表述和管理、知識的組合調度、知識的運用,邏輯推理、規劃、邏輯程序設計及計算,模糊管理、神經網絡、遺傳算法、復雜系統、人工生命等,以及計算機視覺、自然語言理解與交互、智能機器人等。
人工智能的本質被認為是對人的思維的信息過程的模擬。目前分為兩個流派,一派為結構模擬,主攻仿人腦結構機制,希望構建出類人腦的智能機器。相應地,一些仿生算法、仿生研究屬于此類。另外一派是功能模擬,不求內部結構和機理機制的相同,但求外特性相似,被稱為工程學方法。它主要是通過一些形式邏輯原則,進行編程與推理計算實現,如文字識別、電腦下棋等,均屬于該派別的成果。工程化方法要求邏輯嚴謹、推理正確、邊界及全部條件已知或可控。故面對簡單問題時效率很高,但面對復雜目標和任務時,程序復雜冗長,一旦考慮不周,則錯誤不可避免。仿生方法邏輯原則(即仿生原則)簡單明確,通常就是邏輯加優化原則,邊界條件和狀態不必完全已知,但要經過長時間的結構及結構參數的學習優化確定,起點門檻較高,但后續維護成本較低,具有自學習、自適應、自完善特征。
人們也將人工智能分為強人工智能(Bottom-upAI)和弱人工智能(Top-downAI)兩種。那些被認為有知覺和自我意識、并能真正推理和解決問題的智能機器系統,屬于強人工智能范疇,也是人工智能的終*愿景。
弱人工智能觀點則認為,機器永遠不可能擁有人一樣的自我知覺意識、推理和解決問題的能力,僅是表象看起來象而已。
例如,到目前為止,人工智能*重要的基礎進展,是維納(NorbertWiener)從理論上證明了,所有智能行為都是反饋機制作用的結果[26]。其它方面,都是零散的、雜亂的。例如,人們開發出了機器視覺,用于指紋、人臉、虹膜等的識別;制造了機器手,用于抓取、搬運、移動物體;研發了語言識別系統、機器翻譯系統,用于多種語言互譯;研發了各類仿生算法,用于進行建模、推理、搜索和數據挖掘;發明了機器學習算法,用以進行知識和經驗的積累。發明了具有自主運動控制系統功能的機器人系統,用以完成特定任務;研究了知識表示方法,并構建了常識知識庫等。
盡管人工智能經過60余年的發展取得了很大進步,但仍然處于相對初級的階段,與全面模擬人的智能的狀態與水平相去甚遠,多數情況下,僅僅是模仿人的某一方面的部分能力??v觀人工智能的發展歷程,正是如此。
4人工智能的計量評價
4.1發展現狀
由于人工智能所涉及的數理邏輯、機器翻譯、智能控制、專家系統、語言和圖像理解、自動程序設計等等,均屬于計量范疇之外的事物,導致人工智能一直都游離于計量校準范疇之外,在人工智能中,人們需要計量校準什么?以及用哪些定量的指標來定量描述人工智能?均是尚無明確、統一共識的問題,此外,用哪些方法和手段計量校準人工智能的功能、性能、發展水平,是人們所*為關注的。
實際上,人們提到人工智能的計量校準,也是指對人工智能系統的計量校準,而非脫離了硬件系統之外的任何其它。
有關人工智能系統的計量校準,已經有了一些先期探索性的嘗試。
美國國家標準技術研究院(NIST)于2019年5月30日舉辦了人工智能標準研討會,討論推動了聯邦參與人工智能標準計劃的制定,制定相應的開發技術標準和相關工具的計劃,以支持AI技術的可靠發展。該類工作,將從定義和標準上推進人工智能的計量進程。
日本經濟產業省的產業技術綜合研究所在2015年5月新設立的人工智能研究中心AIRC(ArtificialIntelligenceResearchCenter),研究范圍包括AI算法(Algorithm)、大數據(BigData)以及計算(Computing),既涉及*基礎的AI理論研究,也包括計算機視覺、自然語言處理等偏應用的研究,同時還有計算及設施的搭建。該類研究,將從公共基礎方面推進人工智能的計量技術進步。
4.2基礎方式
由于人工智能的全部發展思想都是在模仿人的智能效果而展現的,其計量校準的基本方式,可以從人的智能的7個維度依次展開,即分別開展語言智能、數理邏輯智能、空間智能、肢體運動智能、音樂智能、人際關系智能、內省智能等的計量校準有關的定義、概念、指標體系、理論體系、方法體系、技術體系研究,設立終*愿景目標,以定量的計量結果和人工判據,給出計量結論。
針對語言智能的計量問題,定義和構建標準語言(語音、語氣、語義、語法)知識庫,建立標準指標體系,發展語言智能水平評價方法,以定量方式評價語言智能水平。
針對數理邏輯智能的定量計量評價,定義指標體系,確立邏輯運算法則,分類邏輯空間維度,發展數理邏輯智能水平評價方法,以定量量化方式評價數理邏輯智能水平。包括數據挖掘、知識積累、機器學習。
針對空間智能的定量計量評價,定義指標體系,分類空間維度,定義空間變換,展現空間變化態勢與規律,發展空間智能水平評價方法,以定量量化方式評價空間智能水平。
針對肢體運動智能的定量計量評價,定義指標體系,確立肢體運動規則,分類肢體運動空間維度,展現肢體運動變化態勢與規律,發展肢體運動智能水平評價方法,以定量量化方式評價肢體運動智能水平。
針對音樂智能的定量計量評價,定義指標體系,分類音樂維度,展現音調、旋律、節奏、音色及其變化態勢與規律,確立評價準則,發展音樂智能水平評價方法,以定量量化方式評價音樂智能水平。
針對人際關系智能的定量計量評價,定義指標體系,分類人際關系維度,展現情緒情感、感覺感受、明示暗示、反應程度等變化態勢與規律,發展人際關系智能水平評價方法,以定量量化方式評價人際關系智能水平。
針對認知智能的定量計量評價,定義指標體系,確立認知智能定量評價規則,分類認知智能空間維度,展現認知變化與規律。包括自身長處和短處、愛好、情緒、意向、脾氣、自尊、獨立思考的認知能力,好奇心、求知欲、觀察力、細微差別識別能力。以及事物的觀察、體察、辨別、分類能力。發展認知智能水平評價方法,以定量量化方式評價認知智能水平。
4.3工程方式
由于人工智能的發展并非一蹴而就,而是由淺入深、由低到高的逐漸發展過程。相應地,其計量校準也可以遵循同樣的規律進行,無需貪大求全,而是針對一個個具體的人工智能系統分別設計、構建、完善、發展。
例如,針對人工智能特征的機器手的計量校準,人們可以按照其愿景目標所涉及的指標,如抓握力值范圍、空間移動范圍及精度、移動速度及加速度、施放速度及加速度、運行軌跡及變化的復雜程度、自平衡性、自穩定性、復現能力、重復能力等不同方面的指標參數,以定量方式進行計量評價,*終給出總體結論。
針對具有行走智能的行走機器人的計量校準,人們可以按照愿景目標所涉及的指標,如走、跑、跳、翻騰,步幅、步速、步態,上下坡、上下樓梯、拐彎避障、崎嶇路面等各種情況下的平衡性、速度及加速度、啟停速度、穩定程度、搖擺角度、受干擾后的自我恢復能力、摔倒后自主恢復行走能力等各個方面性能,進行定量計量評價。
針對人機對弈這類人工智能系統,如深藍(DeepBlue)、阿爾法狗(AlphaGo),以數理邏輯推理見長,其計量評價工作,首先要評定和判斷其是否適應和勝任目標工作,其次是在能勝任目標工作的前提下,針對確定任務目標完成所用的能效時間比,體現其智能水平高低。即在相同的時間下,計算所消耗的能量越少(運算步驟越少),能效越高,智能水平越高;在能效相同的條件下,計算所用時間越短,智能水平越高。
針對機器視覺系統,以空間感知及表述為愿景目標,其計量評價工作,應首先使用一系列標準的模型,包括三維空間模型及場景,靜、動態變化態勢及規律。通過這些模型的識別及表述與真實狀況的一致性及差異性,跟蹤感知速度、加速度等,定量評價其智能水平。
針對各類目標明確而具體的專家系統,以其具體任務的愿景目標為特征對象,開展計量性研究,通過對其系統性技術指標體系,定量評價其智能水平。
5總體計量
當存在兩種以上智能時,人工智能變成了多元智能或多維智能,其計量校準將包括它們如何進行總體評價或綜合評價問題。具體做法將包括不同智能的各自計量校準,以及面向不同具體目標任務時,不同維度智能的維度分類判別,加權合成,問題細化歸類等各個方面。*后給出一個總體判斷結果或總體結論性依據。即智能水平高低的單一化定量評估結果。*有可能的綜合計量結果,將是針對某一具體目標任務時,在勝任目標任務情況下,其所花費的時間與能效之比。相同時間下,其能效越高,耗能越少,智能水平越高;相同能效水平下,所用時間越短,智能水平越高。
關于能效水平,對于具體任務目標的運算而言,使用折合成加法運算次數是一種可行的選擇,運算次數多者顯然能效水平低。
6討論
實際上,有關人工智能,一直存在幾個有爭議的問題:
1)人工智能能否被計量校準?
2)若能,則應校準哪些內容?
3)如何校準人工智能?何為標準?溯源到哪些基本量?
4)如何給出人工智能的校準結果?
首先,人工智能雖然稱為智能,但也不是憑空存在的,一定需要一個載體。所以,人工智能的計量校準,實際上是指人工智能系統智能特性的計量校準。斯坦福大學的NilsJohnNilsson教授[27]曾經對人工智能做過一個定義:“人工智能是關于知識的學科———是怎樣表示知識、怎樣獲得知識并使用知識的科學”[28],是非常有道理的。怎樣表示知識,包括進行一些基本概念的定義,一些基本的數學物理邏輯及其運算和演化法則,形成概念和數理邏輯法則庫。另外有一些確切激勵響應特性的因果關系模型,則作為知識被保留和表述,形成知識庫。系統獲得知識的渠道是從大量數據事件中分類、分析,篩選出具有明確因果關系的事件,并將其因果關系并入知識庫,從而完成一次知識積累和智能系統學習成長過程。其知識庫源于數據庫,但又不等同于數據庫。數據庫龐大、原始、豐富,而知識庫間接、小巧,便于高效快捷應用。知識的使用,主要是定義、知識庫、數理邏輯的靈活運用。
人工智能系統的計量校準,既可以是針對明確而具體目標的外在激勵響應特性的計量校準,也可以是上述內在特性的計量校準,包括其自身資源的計量評價:1)主觀自身的先天資源;如硬件資源,定義、概念資源,數理邏輯資源,因果關系知識庫資源等;2)通過學習獲得并增加到因果關系知識庫的累加資源;3)綜合、整合、應用知識資源的權重、法則、習慣、先進性評價;4)主客觀互動的適應性、應變能力(任務導航、制導特性,激勵反饋特性)等的定量評價。這些內在特性,從內在方面體現了系統的人工智能水平。當然,其完整性實現難度更大些,更適合人工智能系統的研制者和生產廠家使用。其中,這些內在特性的計量評價,可能更需要首先對人工智能系統進行計量性設計才能實現[29]。
7結論
綜上所述可見,人工智能的計量校準主要指人工智能系統的計量校準,在良好的計量性設計前提下,可望通過人工智能的計量校準手段對其智能水平進行定量評價。除此以外,競賽法則也是可行的評價方式之一,但不夠全面和徹底,某一方面的單一優勢即可能獲得競賽的優勝,但不能保證其它應用的效果良好。本文所述內容,是對于人工智能在計量技術發展的一種提示與期待,希冀適應AI的發展潮流,意在促進行業的發展和技術的進步。
百檢網平臺服務質量承諾
行為公正: 自覺遵守公正性聲明。
方法科學: 遵循科學求實原則,嚴格按照規定的方法從事校準工作。
結果: 證書規范嚴謹、數據可靠。
工作: 根據實際情況和客戶需求,不斷改進業務流程,確保校準工作在承諾的時間內完成。
收費合理: 校準費用不高于國家及省、市物價部門批準的收費標準,不高于同行平均水平。
客戶滿意: 主動了解客戶需要, 提供服務, 及時受理和處置客戶的投訴,提供快捷、方便的后續服務
百檢網專業的第三方計量校準檢測機構,有各種計量儀器設備檢測需求及詳情免費咨詢機構在線顧問:400-101-7153,做檢測上百檢網 www.www-18484.com -出具權威檢測報告具有法律效力。
Copyright ? 2021 百檢(上海)信息科技有限公司 版權所有 滬ICP備19010749號-17
地址:上海市閔行區宜山路2000號 電話:13262752056 郵箱:service@baijiantest.com
關注我們