這本教科書介紹了適合高級本科生和研究生的信息論主題。它發展了經典的香農理論和最近在統計學習中的應用。全文共分為五個部分:信息化措施的基礎;(無損)數據壓縮;二元假設檢驗與大偏差理論;信道編碼和信道容量;有損數據壓縮;最后是統計應用。有超過150個練習,包括幫助讀者了解和關注文獻中的最新發現。這本書是信息論領域的現代導論。在過去的二十年里,信息論已經從一門主要處理信息存儲和傳輸問題(“編碼”)的學科發展到越來越關注信息提取和去噪(“學習”)的學科。這種轉變反映在本書的標題和內容上。這些內容來自于作者十多年來在麻省理工學院、伊利諾伊大學和耶魯大學教授常規課程,以及在EPFL(瑞士)和ENSAE(法國)教授短期課程的課堂筆記。我們的意圖是將這份手稿用作研究生(和高級本科生)的第一門信息論課程的教科書,或者用于深入研究特定領域的第二門(主題)課程。這本書的一個重要部分致力于信息理論方法的闡述,這些方法在其他領域,如統計學習和計算機科學,已經發現了有影響力的應用。(具體來說,我們涵蓋了Kolmogorov的度量熵,強數據處理不等式,以及統計估計的熵上界)。我們還包括一些不太知名的經典材料(例如,與遍歷性的聯系)以及最新的發展,這些材料通常在練習中涵蓋(遵循Csiszár和K?rner[81]的風格)。
信息論研究了信息流動、表示和傳輸的數學規律,就像物理學研究物理宇宙行為的規律一樣。信息論的基礎是在通信背景下建立的,它描述了通信的基本限制,并提供了代碼(有時稱為算法)來實現它們。 該領域最重要的成就是數字通信的發明,它構成了我們日常生活中的數字產品,如智能手機、筆記本電腦和物聯網設備的基礎。近年來,信息論在過去幾十年發生革命性變革的一個熱門領域——數據科學中,也發揮了重要作用。
本書旨在展示信息論在不斷擴大的數據科學應用領域中的現代作用。本書的第一部分和第二部分涵蓋了信息論的核心概念:關于若干關鍵概念的基本概念;以及關于通信基本限制的著名源和信道編碼定理。最后一部分關注數據科學中出現的應用,包括社交網絡、排名和機器學習。 本書作為信息論和通信領域的高年級本科生和研究生的教材,同時也應該成為這些領域專業人士和工程師的寶貴參考資料。
這本書的寫作是由數據科學研究活動的激增以及信息理論在該領域中的作用所激發的。這構成了本書的動機,使其具有三個關鍵特點。
第一個特點是在數據科學應用場景下展示信息理論的原則和工具,例如社交網絡、DNA測序、搜索引擎和人工智能(AI)。信息理論是一個基礎性的領域,對科學和工程的廣泛領域產生了重要影響。它由克勞德·香農于1948年創立,研究信息流動、表示和傳輸的數學規律。該領域最重要的成就是數字通信的發明,它是我們日常生活中的數字產品如智能手機、筆記本電腦和物聯網(IoT)設備的基礎。盡管該領域起源于通信,但它已經擴展到原始領域之外,為各種各樣的背景做出貢獻,包括網絡、計算生物學、量子科學、經濟學、金融,甚至博彩。因此,過去幾十年里出版了幾本關于信息理論的書籍,涵蓋了廣泛的主題(Gallager,1968;Cover,1999;MacKay,2003;Yeung,2008;Csiszár和K?rner,2011;El Gamal和Kim,2011;Gray,2011;Gleick,2011;Pierce,2012;Wilde,2013)。然而,本書關注的是一個領域:數據科學。在豐富的內容中,我們強調與數據科學應用相關的信息論概念和工具。這些應用包括:社交網絡中的社區檢測、生物網絡中的DNA測序、搜索引擎中的排名、有監督學習、無監督學習和社交AI。
第二,本書采用講座式的格式編寫。關于這個主題的大多數書籍都涉及許多數學概念和理論,以及各種領域的各種應用。概念和相關理論以字典式的組織方式呈現,主題按順序列出。盡管這種字典式的組織方式便于查找特定材料,但它通常缺乏一個有凝聚力的敘述,無法吸引和激勵讀者。本書旨在吸引和激勵那些對數據科學及其與其他學科的相互聯系感興趣的人。我們的目標是創造一個引人入勝的敘述,強調該領域基礎知識的重要性。為實現這一目標,我們采用了講座式的格式,每個章節都作為一次約80分鐘的講座的筆記。通過主題和概念在各章節之間建立了一致的聯系。為確保從一個章節到另一個章節的順利過渡,我們包括了兩段內容:(i)“回顧”段落,總結了已經涉及的內容,并激發了當前章節的內容;(ii)“展望”段落,通過將其與之前的材料聯系起來,引入即將出現的內容。
本書的最后一個特點是通過兩種軟件語言包含許多編程練習:(i)Python;和(ii)TensorFlow。盡管C++和MATLAB在傳統領域得到了廣泛應用,但Python已成為數據科學的關鍵軟件。考慮到本書涉及的數據科學應用的廣度,我們選擇Python作為主要平臺。為了實現機器學習和深度學習算法,我們使用TensorFlow,這是最受歡迎的深度學習框架之一。TensorFlow為深度學習中的許多重要過程提供了許多內置功能,并與Keras(一種強調快速用戶實驗的高級庫)集成。通過Keras,我們可以輕松地從想法轉變為實現,步驟最少。
這是一本關于線性代數和矩陣理論的書。雖然它是獨立的,但它最適合那些已經接觸過線性代數的人。我們還假設讀者已經學過微積分。然而,有些可選主題需要更多的分析。我認為線性代數可能是本科數學課程中討論的最重要的主題。這樣做的部分原因是它有助于統一這么多不同的主題。線性代數在分析、應用數學甚至理論數學中都是必不可少的。這是本書的觀點,而不是單純地介紹線性代數。這就是為什么有許多應用程序,其中一些相當不尋常。這本書的特點是在書的早期對決定因素進行了基本的和完整的處理。本書介紹了線性代數中使用的各種數值方法。這樣做是因為這些方法很有趣。這里的演示強調了它們工作的原因。它沒有討論有效地使用這些方法所必需的許多重要的數值考慮。這些考慮可以在數值分析文本中找到。在練習中,你可能偶爾會在開頭看到↑。這意味著你應該看看上面的練習。一些練習循序漸進地展開一個主題。還有一些練習在書中出現了不止一次。我故意這樣做,因為我認為這些說明了非常重要的主題,也因為有些人不會從頭到尾閱讀整本書,而是直接跳到中間。有一個關于Sylvester定理的出現不少于3次。文中也對其進行了證明。Cayley Hamilton定理有很多證明,一些在練習中。為了強調前一章已經完成的內容,本書還包括了一些練習。
//open.umn.edu/opentextbooks/textbooks/210
本書旨在為數學、物理科學、工程和相關領域的學生介紹概率論和數理統計。它基于作者25年的概率教學經驗,旨在幫助學生克服學習該學科的常見困難。這本書的重點是對理論的解釋,主要是用了許多例子。在可能的情況下,提供所述結果的證明。所有章節都以一個簡短的問題列表結束。這本書還包括幾個可選的更高級的主題部分。這本教科書非常適合概率論的第一課。內容:概率、條件概率和獨立隨機變量及其分布、隨機變量的運算、期望值、方差和協方差、隨機分布向量、極限定理、數理統計附錄書目索引。
這本書是提供信息理論和錯誤控制編碼的全面概述,使用一個不同的方法然后在現有的文獻。章節根據香農系統模型組織,其中一個區塊影響其他區塊。在每一章的開始提供一個相對簡短的理論介紹,包括一些額外的例子和解釋,但沒有任何證明。并在相應章節的末尾對抽象代數的一些方面作了簡要的概述。帶有大量插圖和表格的典型復雜例子被選擇來提供對問題本質的詳細見解。給出了一些極限情況來說明與理論界的聯系。仔細選擇數值,以提供所描述的算法的深入解釋。雖然不同章節中的例子可以單獨考慮,但它們是相互聯系的,一個考慮的問題的結論與書中的其他問題有關。
//link.springer.com/book/10.1007/978-3-319-49370-1
算法設計藝術是對所有算法設計書籍的補充感知,是所有層次學習者以及處理算法問題的專業人員的路線圖。此外,這本書提供了一個全面的介紹算法,涵蓋了相當深的,但使他們的設計和分析,以所有層次的讀者。所有的算法都是用“偽代碼”來描述和設計的,任何不懂編程的人都可以讀懂。
本書包括一系列綜合問題及其針對每種算法的解決方案,以展示其執行評估和復雜性,目標是:
數據科學概率導論
這本書是大學概率論的入門教材。它有一個使命: 闡明我們在科學和工程中使用的概率工具的動機、直覺和含義。從超過五年的課程教學中,我提煉出了我認為是概率方法的核心。我把這本書放在數據科學的背景下,以強調數據(計算)和概率(理論)在我們這個時代的不可分離性。
地址: //probability4datascience.com/index.html
概率論是電子工程和計算機科學中最有趣的學科之一。它將我們喜愛的工程原理與現實聯系起來,這是一個充滿不確定性的世界。然而,因為概率是一門非常成熟的學科,單是本科生的課本就可能在圖書館的書架上擺滿好幾排書。當文學如此豐富時,挑戰就變成了一個人如何在深入細節的同時洞察到洞察力。例如,你們中的許多人以前使用過正態隨機變量,但你們是否想過“鐘形”是從哪里來的?每一門概率課都會教你拋硬幣,但是“拋硬幣”在今天的機器學習中有什么用呢?數據科學家使用泊松隨機變量來模擬互聯網流量,但是這個漂亮的泊松方程是從哪里來的呢?這本書的目的是填補這些知識的差距,這是所有數據科學學生必不可少的。
這就引出了本書的三個目標。(i) 動機: 在數學定義、定理、方程的海洋中,為什么我們要把時間花在這個主題上,而不是其他的? (ii) 直覺: 當進行推導時,在這些方程之外是否有幾何解釋或物理學?(iii) 言外之意: 當我們學習了一個話題后,我們可以解決哪些新問題?本書的目標讀者是電子工程和計算機科學專業的本科生三、四年級和一年級研究生。先決條件是標準的本科線性代數和微積分,除了需要傅里葉變換的特征函數部分。一門信號與系統的本科課程就足夠了,即使是在學習這本書的同時選修。
這本書的篇幅適合兩學期的課程。教師被鼓勵使用最適合他們的課程的章節集。例如,基本概率課程可以使用第1-5章作為主干。關于樣本統計的第6章適合希望獲得概率收斂理論見解的學生。關于回歸的第七章和關于估計的第八章最適合學習機器學習和信號處理的學生。第9章討論了對現代數據分析至關重要的置信區間和假設檢驗。第10章介紹了隨機過程。我的隨機過程方法更適合于信息處理和通信系統,這通常與電氣工程專業的學生更相關。
本書特色:
涵蓋范圍廣,從經典的概率論到現代數據分析技術 概念的幾何和圖形解釋 與MATLAB / Python緊密集成 機器學習的實際應用
目錄內容
Chapter 1 Mathematical Background Chapter 2 Probability Chapter 3 Discrete Random Variables Chapter 4 Continuous Random Variables Chapter 5 Joint Distributions Chapter 6 Sample Statistics Chapter 7 Regression Chapter 8 Estimation Chapter 9 Confidence and Hypothesis Chapter 10 Random Processes
這本最新的教科書是向數學、計算機科學、工程、統計學、經濟學或商業研究的新學生介紹概率論和信息理論的一個極好的方式。它只需要基本的微積分知識,首先建立一個清晰和系統的基礎: 通過對布爾代數度量的簡化討論,特別關注概率的概念。這些理論思想隨后被應用到實際領域,如統計推斷、隨機游走、統計力學和通信建模。主題涵蓋了離散和連續隨機變量,熵和互信息,最大熵方法,中心極限定理和編碼和信息傳輸,并為這個新版本添加了關于馬爾可夫鏈和它們的熵的材料。大量的例子和練習包括說明如何使用理論在廣泛的應用,與詳細的解決方案,大多數練習可在網上找到。
對機器學習和數據挖掘很感興趣,但是數學表示法看起來又奇怪又不直觀,那就看看這本書吧。它從概率和線性代數開始,逐漸建立到現代研究論文中使用的常見符號和技術-重點是簡單、可愛和實際使用的基本技術。它充滿了大量的簡單的例子,數以百計的插圖和解釋,突出的幾何解釋正在發生什么。抽象的數學和分析技術和模型的動機是真實的問題,并提醒讀者在使用這些強大的工具時內在的倫理考慮。
本書的目的是介紹了許多現代數據分析所需的基本數學原理和技術。特別是,它是由主要在兩門課程中講授的材料構建而成的。第一個是早期的本科課程,旨在幫助學生在嚴格的機器學習和數據挖掘課程中取得成功。第二門課程是高級數據挖掘課程。它應該對這類課程的任何組合都有用。這本書介紹了在本科課程中經常缺席或簡短的關鍵概念工具,對大多數學生來說,有助于多次看到。在這些基礎之上,它介紹了構成現代數據分析主干的最基本技術的通用版本。然后深入探討一些更高級的主題和技術——仍然專注于清晰、直觀和持久的想法,而不是不斷發展的最新技術中的具體細節。
本書范圍
引入的重要概念包括度量的集中和PAC邊界、交叉驗證、梯度下降、各種距離、主成分分析和圖表。這些思想對于現代數據分析是必不可少的,但在計算機科學或數學系的其他數學入門課程中卻很少教授。或者,如果教授這些概念,它們是在一個非常不同的背景下呈現的。
我們對監督(回歸和分類)和非監督(主成分分析和聚類)學習的基本技術做了闡述。我們努力使這些主題的表述和概念保持簡單。我們最初主要堅持那些試圖最小化誤差平方和的方法。我們首先使用經典但很有效的算法,如Lloyd的k-means,冪法的特征向量,和感知器的線性分類。對于許多學生(甚至是計算機科學課程的學生)來說,這是他們遇到的第一個迭代的、非離散的算法。有時,這本書冒險超出這些基礎知識,進入概念,如正則化和Lasso,局部敏感哈希,多維尺度,光譜聚類,神經網絡基礎,和數據草圖。這些課程可以穿插進去,讓課程更深入,更高級,因為適合學生的水平。
本教程關注信息理論在統計學中的應用。被稱為信息散度或Kullback-Leibler距離或相對熵的信息度量起著關鍵作用。涵蓋的主題包括大偏差、假設檢驗、指數族的最大似然估計、列聯表的分析以及具有“信息幾何”背景的迭代算法。同時,還介紹了通用編碼的理論,以及由通用編碼理論驅動的最小描述長度原理的統計推理。
本書是信息論領域中一本簡明易懂的教材。主要內容包括:熵、信源、信道容量、率失真、數據壓縮與編碼理論和復雜度理論等方面的介紹。
本書還對網絡信息論和假設檢驗等進行了介紹,并且以賽馬模型為出發點,將對證券市場研究納入了信息論的框架,從新的視角給投資組合的研究帶來了全新的投資理念和研究技巧。
本書適合作為電子工程、統計學以及電信方面的高年級本科生和研究生的信息論基礎教程教材,也可供研究人員和專業人士參考。
本書是一本簡明易懂的信息論教材。正如愛因斯坦所說:“凡事應該盡可能使其簡單到不能再簡單為止。''雖然我們沒有深人考證過該引語的來源(據說最初是在幸運蛋卷中發現的),但我們自始至終都將這種觀點貫穿到本書的寫作中。信息論中的確有這樣一些關鍵的思想和技巧,一旦掌握了它們、不僅使信息論的主題簡明,而且在處理新問題時提供重要的直覺。本書來自使用了十多年的信息論講義,原講義是信息論課程的高年級本科生和一年級研究生兩學期用的教材。本書打算作為通信理論.計算機科學和統計學專業學生學習信息論的教材。
信息論中有兩個簡明要點。第一,熵與互信息這樣的特殊量是為了解答基本問題而產生的。例如,熵是隨機變量的最小描述復雜度,互信息是度量在噪聲背景下的通信速率。另外,我們在以后還會提到,互信息相當于已知邊信息條件下財富雙倍的增長。第二,回答信息理論問邀的答案具有自然的代數結構。例如,熵具有鏈式法則,因而,謫和互信息也是相關的。因此,數據壓縮和通信中的問題得到廣泛的解釋。我們都有這樣的感受,當研究某個問題時,往往歷經大量的代數運算推理得到了結果,但此時沒有真正了解問題的全莪,最終是通過反復觀察結果,才對整個問題有完整、明確的認識。所以,對一個問題的全面理解,不是靠推理,而是靠對結果的觀察。要更具體地說明這一點,物理學中的牛頓三大定律和薛定諤波動方程也許是最合適的例子。誰曾預見過薛定諤波動方程后來會有如此令人敬畏的哲學解釋呢?
在本書中,我們常會在著眼于問題之前,先了解一下答案的性質。比如第2章中,我們定義熵、相對熵和互信息,研究它們之間的關系,再對這些關系作一點解釋·由此揭示如何融會貫通地使用各式各樣的方法解決實際問題。同理,我們順便探討熱力學第二定律的含義。熵總是增加嗎?答案既肯定也否定。這種結果會令專家感興趣,但初學者或i午認為這是必然的而不會深人考慮。
在實際教學中.教師往往會加人一自己的見解。事實上,尋找無人知道的證明或者有所創新的結果是一件很愉快的事情。如果有人將新的思想和已經證明的內容在課堂上講解給學生,那么不僅學生會積極反饋“對,對,對六而且會大大地提升教授該課程的樂崆我們正是這樣從研究本教材的許多新想法中獲得樂趣的。
本書加人的新素材實例包括信息論與博弈之間的關系,馬爾可夫鏈背景下熱力學第二定律的普遍性問題,信道容量定理的聯合典型性證明,赫夫曼碼的競爭最優性,以及關于最大熵譜密度估計的伯格(回定理的證明。科爾莫戈羅夫復雜度這一章也是本書的獨到之處。面將費希爾信息,互信息、中心極限定理以及布倫一閔可夫斯基不等式與熵冪不等式聯系在一起,也是我們引以為豪之處。令我們感到驚訝的是.關于行列式不等式的許多經典結論,當利用信息論不等式后會很容易得到證明。
自從香農的奠基性論文面世以來,盡管信息論已有了相當大的發展,但我們還是要努力強調它的連貫性。雖然香農創立信息論時受到通信理論中的問題啟發,然而我們認為信息論是一門獨立的學科,可應用于通信理論和統計學中。我們將信息論作為一個學科領域從通信理論、概率論和統計學的背景中獨立出來因為明顯不可能從這些學科中獲得難以理解的信息概念。由于本書中絕大多數結論以定理和證明的形式給出,所以,我們期望通過對這些定理的巧妙證明能說明這些結論的完美性。一般來講,我們在介紹問題之前先描述回題的解的性質,而這些很有的性質會使接下來的證明順理成章。
使用不等式串、中間不加任何文字、最后直接加以解釋,是我們在表述方式上的一項創新希望讀者學習我們所給的證明過程達到一定數量時,在沒有任何解釋的情況下就能理解其中的大部分步,并自己給出所需的解釋這些不等式串好比模擬到試題,讀者可以通過它們確認自己是否已掌握證明那些重要定理的必備知識。這些證明過程的自然流程是如此引人注目,以至于導致我們輕視了寫作技巧中的某條重要原則。由于沒有多余的話,因而突出了思路的邏輯性與主題思想u我們希望當讀者閱讀完本書后,能夠與我們共同分亨我們所推崇的,具有優美、簡潔和自然風格的信息論。
本書廣泛使用弱的典型序列的方法,此概念可以追溯到香農1948年的創造性工作,而它真正得到發展是在20世紀70年代初期。其中的主要思想就是所謂的漸近均分性(AEP),或許可以粗略地說成“幾乎一切事情都是等可能的"
第2章闡述了熵、相對熵和互信息之同的基本代數關系。漸近均分性是第3章重中之重的內容,這也使我們將隨機過程和數據壓縮的熵率分別放在第4章和第5章中論述。第6章介紹博弈,研究了數據壓縮的對偶性和財富的增長率。可作為對信息論進行理性思考基礎的科爾莫戈羅夫復雜度,擁有著巨大的成果,放在第14章中論述。我們的目標是尋找一個通用的最矩描述,而不是平均意義下的次佳描述。的確存在這樣的普遍性概念用來刻畫一個對象的復雜度。該章也論述了神奇數0,揭示數學上的不少奧秘,是圖靈機停止運轉概率的推廣。第7章論述信道容量定理。第8章敘述微分熵的必需知識,它們是將早期容量定理推廣到連續噪聲信道的基礎。基本的高斯信道容量問題在第9章中論述。第il章闡述信息論和統計學之間的關系,20世紀年代初期庫爾貝克首次對此進行了研究,此后相對被忽視。由于率失真理論比無噪聲數據壓縮理論需要更多的背景知識,因而將其放置在正文中比較靠后的第10章。
網絡信息理論是個大的主題,安排在第巧章,主要研究的是噪聲和干擾存在情形下的同時可達的信息流。有許多新的思想在網絡信息理論中開始活躍起來,其主要新要素有干擾和反饋第16章講述股票市場,這是第6章所討論的博弈的推廣,也再次表明了信息論和博弈之間的緊密聯系。第17章講述信息論中的不等式,我們借此一隅把散布于全書中的有趣不等式重新收攏在一個新的框架中,再加上一些關于隨機抽取子集熵率的有趣新不等式。集合和的體積的布倫一閔可夫斯基不等式,獨立隨機變量之和的有效方差的熵冪不等式以及費希爾信息不等式之間的美妙關系也將在此章中得到詳盡的闡述。
本書力求推理嚴密,因此對數學的要求相當高·要求讀者至少學過一學期的概率論課程且有扎實的數學背景,大致為本科高年級或研究生一年級水平。盡管如此,我們還是努力避免使用測度論。因為了解它只對第16章中的遍歷過程的AEP的證明過程起到簡化作用。這符合我們的觀點,那就是信息論基礎與技巧不同,后者才需要將所有推廣都寫進去。
本書的主體是第2,3,4,5,7,8,9,10,11和巧章,它們自成體系,讀懂了它們就可以對信息論有很好的理解。但在我們看來,第14章的科爾莫戈羅夫復雜度是深人理解信息論所需的必備知識。余下的幾章,從博弈到不等式.目的是使主題更加連貫和完美。