知識表示和推理是人工智能挑戰的核心: 要充分理解智能和認知的本質,使計算機能夠表現出類似人類的能力。早在1958年,約翰·麥卡錫(John McCarthy)就考慮過可以運用常識的人工智能系統。從這些早期工作中,研究人員確信(人工)智能可以被形式化為具有明確知識表征的符號推理,而研究的核心挑戰是弄清楚如何在計算機中表示知識,并使用它的算法來解決問題。
多年以后,這本書調研了構成知識表示和推理領域的大量科學和工程見解。在三個方面取得了進展。首先,研究人員探索了知識表示和推理的一般方法,解決了跨越應用領域的基本問題。其次,研究人員開發了專門的知識表示和推理方法來處理核心領域,如時間、空間、因果關系和行動。第三,研究人員處理了知識表示和推理的重要應用,包括查詢回答、規劃和語義網。因此,本書分為三個部分來涵蓋這些主題。
//www.elsevier.com/books/handbook-of-knowledge-representation/van-harmelen/978-0-444-52211-5
第一部分主要介紹人工智能系統中表示知識的一般方法。它從經典邏輯和定理證明的背景開始,然后轉向擴展經典邏輯的新方法——例如,處理定性的或不確定的信息——并改進其計算可處理性。
第二部分探討了用知識的一些核心領域(包括時間、空間、因果關系和行動)來表示和推理的特殊挑戰。這些挑戰在應用程序領域中普遍存在,因此解決方案必須是通用的和可組合的。
第三部分介紹了知識表示和推理的重要應用。應用領域涵蓋了人工智能的廣度,包括問題回答、語義網、計劃、機器人和多智能體系統。每一項應用都廣泛借鑒了第一部分和第二部分中所述的研究結果。
此外,這25章,組織在三個部分“一般方法”,“專門的表示和“應用”,提供了一個獨特的調研,最好的知識表示已經取得,由幫助塑造領域的研究人員寫。我們希望學生,研究人員和從業者在所有領域的人工智能和認知科學將發現這本書是一個有用的資源。
概率圖模型的形式化為捕獲隨機變量之間的復雜依賴關系和建立大規模多元統計模型提供了統一的框架。圖模型已經成為許多統計、計算和數學領域的研究焦點,包括生物信息學、通信理論、統計物理、組合優化、信號和圖像處理、信息檢索和統計機器學習。在特定情況下出現的許多問題- -包括計算邊緣值和概率分布模式的關鍵問題。利用指數族表示,并利用指數族累積函數和熵之間的共軛對偶性,我們提出了計算概率、邊際概率和最可能配置問題的一般變分表示。我們描述了各種各樣的算法,其中sum-product集群變分方法,expectation-propagation,平均場方法,max-product和線性規劃松弛——都可以理解的精確或近似形式的變分表示。變分方法提供了一個補充替代馬爾科夫鏈蒙特卡洛作為在大規模統計模型推理的方法。
這是我2004年,2006年和2009年在斯坦福大學教授的概率理論博士課程的講義。本課程的目標是為斯坦福大學數學和統計學系的博士生做概率論研究做準備。更廣泛地說,文本的目標是幫助讀者掌握概率論的數學基礎和在這一領域中證明定理最常用的技術。然后將此應用于隨機過程的最基本類的嚴格研究。
為此,我們在第一章中介紹了測度與積分理論中的相關元素,即事件的概率空間與格-代數、作為可測函數的隨機變量、它們的期望作為相應的勒貝格積分,以及獨立性的重要概念。
利用這些元素,我們在第二章中研究了隨機變量收斂的各種概念,并推導了大數的弱定律和強定律。
第三章討論了弱收斂的理論、分布函數和特征函數的相關概念以及中心極限定理和泊松近似的兩個重要特例。
基于第一章的框架,我們在第四章討論了條件期望的定義、存在性和性質,以及相關的規則條件概率分布。
第五章討論了過濾、信息在時間上的級數的數學概念以及相應的停止時間。關于后者的結果是作為一組稱為鞅的隨機過程研究的副產品得到的。討論了鞅表示、極大不等式、收斂定理及其各種應用。為了更清晰和更容易的表述,我們在這里集中討論離散時間的設置來推遲與第九章相對應的連續時間。
第六章簡要介紹了馬爾可夫鏈的理論,概率論的核心是一個龐大的主題,許多教科書都致力于此。我們通過研究一些有趣的特殊情況來說明這類過程的一些有趣的數學性質。
在第七章中,我們簡要介紹遍歷理論,將注意力限制在離散時間隨機過程的應用上。我們定義了平穩過程和遍歷過程的概念,推導了Birkhoff和Kingman的經典定理,并強調了該理論的許多有用應用中的少數幾個。
第八章建立了以連續時間參數為指標的右連續隨機過程的研究框架,引入了高斯過程族,并嚴格構造了布朗運動為連續樣本路徑和零均值平穩獨立增量的高斯過程。
第九章將我們先前對鞅和強馬爾可夫過程的處理擴展到連續時間的設定,強調了右連續濾波的作用。然后在布朗運動和馬爾可夫跳躍過程的背景下說明了這類過程的數學結構。
在此基礎上,在第十章中,我們利用不變性原理重新構造了布朗運動作為某些重新標定的隨機游動的極限。進一步研究了其樣本路徑的豐富性質以及布朗運動在clt和迭代對數定律(簡稱lil)中的許多應用。
這是為未來的科學家和工程師準備的微積分介紹的第二卷。第二卷是第一卷的延續,包括第六到第十二章。第六章介紹了向量、向量運算、向量的微分與積分及其應用。第七章研究了以向量形式表示的曲線和曲面,并研究了與這些形式相關的向量運算。此外,還研究了用矢量表示法表示密度、表面積和體積元素的方法。方向導數是與其他向量運算及其屬性一起定義的,因為這些額外的向量使我們能夠找到具有多個變量的函數的最大值和最小值。第八章研究標量場和向量場以及涉及這些量的運算。詳細研究了高斯散度定理、斯托克斯定理和平面上的格林定理及其相關應用。第九章介紹了來自科學和工程選定領域的向量的應用。第十章介紹了矩陣演算和差分演算。第十一章介紹了概率論和統計學。第十章和第十一章之所以出現,是因為在當今社會,技術發展正趨向于一個數字化的世界,學生們應該接觸到一些運算性的微積分,這是為了理解這些技術所需要的。第十二章是作為一個后續想法,介紹那些對數學的一些更高級的領域感興趣的人。
如果你是微積分的初學者,那么一定要確保你有適當的代數和三角的背景材料。如果你有不明白的地方,不要害怕向你的老師提問。去圖書館找一些其他的微積分書,從不同的角度來介紹這門學科。在因特網上,人們可以找到許多微積分的幫助。在因特網上,人們還可以找到許多關于微積分應用的說明。這些額外的學習輔助將向你展示在不同的微積分科目上有多種方法,應該有助于你的分析和推理技能的發展。
//www.math.odu.edu/~jhh/Volume-2.PDF
為機器配備對世界實體及其關系的全面了解一直是人工智能的一個長期目標。在過去的十年中,大規模知識庫(也稱為知識圖譜)已經從Web內容和文本源中自動構建出來,并且已經成為搜索引擎的關鍵模塊。這種機器知識可以被用來從語義上解釋新聞、社交媒體和網絡表格中的文本短語,并有助于回答問題、自然語言處理和數據分析。本文調查基本概念和實際的方法來創建和管理大型知識庫。它涵蓋了用于發現和規范化實體及其語義類型以及將它們組織成干凈的分類法的模型和方法。在此基礎上,本文討論了以實體為中心的屬性的自動提取。為了支持機器知識的長期生命周期和質量保證,本文提出了構建開放模式和知識管理的方法。學術項目的案例研究和工業知識圖表補充了概念和方法的調查。
概述
增強計算機的“機器知識”,可以推動智能應用是計算機科學的一個長期目標[323]。由于知識獲取方面取得了重大進展,這一以前難以捉摸的愿景如今已變得切實可行。這包括將嘈雜的互聯網內容轉化為實體和關系上的清晰知識結構的方法。知識獲取方法使得自動建設知識庫(KB):機器可讀的關于現實世界的事實的集合。如今,公開的KBs提供了數以百萬計的實體(比如人、組織、地點和書籍、音樂等創意作品)和數十億的聲明(比如誰研究了哪里,哪個國家擁有哪一種資本,或者哪位歌手演唱了哪首歌)。大公司部署的專有KBs包含了更大范圍的知識,有一到兩個數量級的實體。
知識庫成為關鍵資產的一個突出用例是Web搜索。當我們向百度、Bing或谷歌發送一個類似“迪倫抗議歌曲”的查詢時,我們會得到一個清晰的歌曲列表,比如《Blowin ' in the Wind》、《Masters of War》或《a- gonna Rain ' s a- gonna Fall》。因此,搜索引擎自動檢測到我們對某一個體實體的事實感興趣——這里是鮑勃·迪倫——并要求特定類型的相關實體——抗議歌曲——作為答案。這是可行的,因為搜索引擎在其后端數據中心有一個巨大的知識庫,有助于發現用戶請求(及其上下文)中的實體,并找到簡明的答案。
本文介紹了從Web和文本源自動構建和管理大型知識庫的方法。我們希望它將對博士生和對廣泛的主題感興趣的教師有用——從機器知識和數據質量到機器學習和數據科學,以及web內容挖掘和自然語言理解的應用。此外,本文還旨在為從事web、社會媒體或企業內容的語義技術的行業研究人員和實踐者提供幫助,包括從文本或半結構化數據構建意義的各種應用程序。不需要有自然語言處理或統計學習的先驗知識;我們將根據需要介紹相關的方法(或至少給出文獻的具體指示)。
這篇文章共分為十章。第2章給出了知識表示的基礎知識,并討論了知識庫的設計空間。第3、4和5章介紹了構建包含實體和類型的知識庫核心的方法。第3章討論了利用具有豐富和干凈的半結構化內容的優質資源,第4章討論了從文本內容中獲取的知識。第5章特別關注將實體規范化為唯一表示的重要問題。第6章和第7章通過發現和提取實體的屬性以及實體之間的關系的方法擴展了知識庫的范圍。第6章主要討論為感興趣的屬性預先設計模式的情況。第7章討論了為KB模式中尚未指定的屬性和關系發現新的屬性類型的情況。第8章討論了知識庫管理和知識庫長期維護的質量保證問題。第9章介紹了幾個具體KBs的案例研究,包括工業知識圖譜(KGs)。我們在第10章以關鍵課程和關于機器知識主題可能走向的展望來結束。
一本簡單易學的傻瓜式C語言入門教程,不怕學不會!
這個新版本提供了一個全面的,豐富多彩的,最新的的人工智能導論,還包括理論基礎。它包括大量的例子,應用程序,全彩圖像,和人類興趣盒,以提高學生的興趣。關于機器人技術和機器學習的新章節現在包括在內。高級主題包括神經網絡、遺傳算法、自然語言處理、規劃和復雜的棋類游戲。
語義表示是自然語言處理的基礎,我們需要將原始文本數據中的有用信息轉換為計算機能夠理解的語義表示,才能實現各種自然語言處理應用。表示學習旨在從大規模數據中自動學習數據的語義特征表示,并支持機器學習進一步用于數據訓練和預測。以深度學習為代表的表示學習技術,能夠靈活地建立對大規模文本、音頻、圖像、視頻等無結構數據的語義表示,顯著提升語音識別、圖像處理和自然語言處理的性能,近年來引發了人工智能的新浪潮。本書是第一本完整介紹自然語言處理表示學習技術的著作。書中全面介紹了表示學習技術在自然語言處理領域的最新進展,對相關理論、方法和應用進行了深入介紹,并展望了未來的重要研究方向。
本書全面介紹了自然語言處理表示學習技術的理論、方法和應用,內容包括三大部分:第一部分介紹了單詞、短語、句子和文檔等不同粒度語言單元的表示學習技術;第二部分介紹了與自然語言密切相關的世界知識、語言知識、復雜網絡和跨模態數據的表示學習技術;第三部分整理了相關開放資源與工具,并探討了面向自然語言處理的表示學習技術面臨的重要挑戰和未來研究方向。本書對于自然語言處理和人工智能基礎研究具有一定的參考意義,既適合專業人士了解自然語言處理和表示學習的前沿熱點,也適合機器學習、信息檢索、數據挖掘、社會網絡分析、語義Web等其他相關領域學者和學生作為參考讀物。
這本受歡迎的教科書的第一版,當代人工智能,提供了一個學生友好的人工智能介紹。這一版完全修訂和擴大更新,人工智能: 介紹機器學習,第二版,保留相同的可訪問性和解決問題的方法,同時提供新的材料和方法。
該書分為五個部分,重點介紹了人工智能中最有用的技術。書的第一部分涵蓋了基于邏輯的方法,而第二部分著重于基于概率的方法。第三部分是涌現智能的特點,探討了基于群體智能的進化計算和方法。接下來的最新部分將提供神經網絡和深度學習的詳細概述。書的最后一部分著重于自然語言的理解。
適合本科生和剛畢業的研究生,本課程測試教材為學生和其他讀者提供關鍵的人工智能方法和算法,以解決具有挑戰性的問題,涉及系統的智能行為在專門領域,如醫療和軟件診斷,金融決策,語音和文本識別,遺傳分析等。
Google AI研究科學家Jacob Eisenstein 博士的自然語言處理領域新書《Introduction to Natural Language Processing》由MIT出版社在10月份發行。在該教材最新版PDF 在 GitHub 上開放。這本書的內容主要分為四大章節,即 NLP 中監督與無監等學習問題、序列與解析樹等自然語言的建模方式、語篇語義的理解,以及后這些技術最在信息抽取、機器翻譯和文本生成等具體任務中的應用。整本開放書共四部分,19章,587頁pdf,是了解最新自然語言處理進展的不可多得的教材。
這本書的主要章節如下可分為四部分:
學習:這一章節介紹了一套機器學習工具,它也是整本教科書對不同問題建模的基礎。由于重點在于介紹機器學習,因此我們使用的語言任務都非常簡單,即以詞袋文本分類為模型示例。第四章介紹了一些更具語言意義的文本分類應用。
序列與樹:這一章節將自然語言作為結構化的數據進行處理,它描述了語言用序列和樹進行表示的方法,以及這些表示所添加的限制。第 9 章介紹了有限狀態自動機(finite state automata)。
語義:本章節從廣泛的角度看待基于文本表達和計算語義的努力,包括形式邏輯和神經詞嵌入等方面。
應用:最后一章介紹了三種自然語言處理中最重要的應用:信息抽取、機器翻譯和文本生成。我們不僅將了解使用前面章節技術所構建的知名系統,同時還會理解神經網絡注意力機制等前沿問題。