當前位置：首頁 » 數據智能 » 人工智慧王楓

人工智慧王楓

發布時間: 2021-03-24 02:14:50

『壹』「人工智慧」，「大數據」+教育如何驅動教育的未來

近日，由論答公司主辦的教育大數據研討會在北京舉行，討論會主題為「大數據+教育，有哪些可能性？」。本次研討會主要關注數據在教育領域的應用，具體包括自適應學習、學習數據分析和教育數據挖掘。來自賓夕法尼亞大學、人民大學、華中師范大學的專家和企業界代表，共同探討了教育大數據和自適應學習領域的技術趨勢和產業機會
Ryan Baker是國際教育數據挖掘協會（International Ecational Data Mining Society）的創始人、《教育數據挖掘》雜志（Journal Ecational Data Mining）主編，在各類期刊和會議發表了260餘篇學術論文，先後主持了美國科學基金會（National Science Foundation）、蓋茨基金會（Gates Foundation）等研究基金的多項重大項目，累計獲得研究經費超過1600萬美元。
他也在哥倫比亞大學教育學院和愛丁堡大學同時擔任教職，他在Coursera和edX上開設的「Big Data in Ecation（教育大數據）」課程，有來自100多個國家和地區的學生注冊。
研討會現場，Ryan Baker通過遠程視頻，分享了他對教育大數據的體驗和應用。據他介紹，目前在教育大數據領域主要有四大研究組織，分別研究人工智慧與教育、教育數據挖掘、學習數據分析和大規模學習。
Ryan Baker表示，在教育領域廣泛應用大數據的時代正在到來。教育數據挖掘有很多的應用方向，包括：預測學生是會輟學，還是會成功完成學業；自動檢測學生的學習投入程度、情感、學習策略，以更好地達到個性化；給教師和其他相關人員提供更好的報告；教育科學的基礎研究和發現。
他認為，個性化教育至少要做到三件事情：
1、確定學生的有關數據；
2、了解對於學生的學習來說什麼是真正重要的；
3、有針對性地為學生提供合適的教學。
而通過教育數據挖掘，我們可以推斷很多事情：
學生的元認知和求助。比如，這個學生有多自信？當他需要幫助時，有沒有在尋求幫助？他有沒有在給自己解釋問題，有沒有思考這個答案是正確的還是錯誤的？最重要的，當他面臨挑戰時，能否堅持下去？
沒有投入學習的行為。比如，「玩弄」系統，為了找到正確的答案，有的學生會試各種不同的答案，從「1」試到「38」。粗心，本身會做，但是不用心，最後給出的答案是錯的。有些孩子會做非常難以解釋的行為，比如不用方程符號，而是畫了一個笑臉。
學生情感。Baker的研究團隊和其他研究團隊，已經創造了研究模型，可以根據數據推斷，學生是否感到厭倦、沮喪、困惑、好奇、興奮、快樂，是否投入，等等。
長期的學習結果。比如，學生能夠記住剛才他學的東西嗎？學生准備好學習下一個主題、下一個知識沒有？中學生能上大學嗎？他會從大學畢業還是輟學？
Ryan Baker表示，要獲得這樣的推斷，只需要學生與系統交互的數據，不需要學生戴上頭盔檢測器。目前，這些模型已經開始大規模應用於自適應學習，應用於幾十萬的美國學生。Ryan Baker列舉了一些自適應學習系統的案例。
Knewton
通過系統決定學生下一個要學習的問題是什麼，已在全球的多個領域多個學科中運用。
ALEKS-ALEKS
用的是先行知識結構和知識點模型，來選擇最適合學生的學習材料。比如，一個學生在學習上出現了問題，系統能夠檢測出來，是以前學的知識點出了問題，然後讓學生回到以前的知識點上去學習。ALEKS系統應用於美國高中、大學的數學、科學學科。
Cognitive Tutor
系統能自動檢測學生的知識，直到學生掌握為止。比如，系統不會讓學生學習下一步的知識，直到他展示出他已經學好了他現在正在學習的知識。系統能夠給學校提供數據報告，學校根據報告能夠更好地讓學生投入到學習中去。每年大約被50萬的美國初高中生用於數學學習。
論答
論答公司的系統與ALEKS的系統有些類似，也是用先行結構和知識點模型，選擇合適的學習材料。同時也是自動檢測學生的知識狀態直到學生掌握為止。應用領域目前包括數學和英語，完全針對中國學生開發。
Reasoning Mind
用各種自動檢測的模型來檢測老師的教學是否有效。通過數據生成報告給每個地區的教學管理員，讓他們找到方法幫助老師提高教學。主要是用於美國的小學數學。
Duolingo
自動檢測學生記憶，來決定什麼時候回顧已經學過的知識。在全世界范圍內應用於外語詞彙的學習。
其他的像Civitas，Course Signals，Zogotech都是地區供應商，運用風險預測模型提供行動信息預測。它們會對學生做出預測，可能學不好、會失敗，把報告提供給老師。已在世界范圍內的大學應用。
Ryan Baker指出，在這些系統中，有足夠的證據證明，至少以下兩個系統是非常好的。
1、胡祥恩教授在美國做了大量實證研究，證明ALEKS系統對於幫助學生學習是有效的。他的研究證明，ALEKS系統對於不同人群的學生是同樣有效的；特別值得提出的是，ALEKS可以幫助少數人群群體提高學習成績。
2、Ryan Baker本人領導的研究團隊與論答公司合作的研究表明，學生通過論答系統學習，比通過傳統的在線學習系統學習，效果更好。他們在中國3個不同的地區做的3次實證研究，都證明了論答系統的有效性。
Ryan Baker分析了教育大數據演算法模型的潛在發展方向。他認為，這些模型的長期潛力是，通過學生的知識和學習模型來確認，學生什麼時候需要更多的支持：
首先是「mastery learning」，學生在掌握一個知識前，不會讓他去學習下一個知識。當學生需要支持的時候，自動介入；同時告訴老師和父母，這個學生什麼時候需要支持。
通過學習投入程度模型判斷，學生什麼時候開始變得厭倦、沮喪了，並調整學習活動，讓厭倦的學生不再厭倦，讓沮喪的學生的學習變得更容易一些。
學習投入程度模型還可以檢測，在線學習中，什麼樣的學習活動，能讓學生更容易地投入進去，並最終發現，什麼樣的學習活動對學生更好、對什麼樣的學生更好。
這樣的模型也能告訴老師和父母，學生什麼時候開始變得不再投入學習了。
還可以運用學習模型確認，學生什麼時候沒有真正學會，需要更多支持。
最後，Ryan Baker指出，下一步的目標是優化之前已經驗證的經驗和方法，然後把它們運用到系統中，最終讓中國和世界上的數十億學生受益。
討論：「因材施教」的千年理想該如何照進現實？
王楓博士，論答公司（Learnta Inc.）創始人兼CEO
胡飛芳博士，美國喬治華盛頓大學（George Washington University）統計學終身教授，中國人民大學統計與大數據研究院的教授
胡祥恩博士，美國孟菲斯大學（University of Memphis）心理系、計算機科學系、計算機工程系終身教授，華中師范大學心理學院院長
馬鎮筠博士，論答公司聯合創始人兼首席數據科學家
辛濤博士，北京師范大學中國基礎教育質量監測協同創新中心常務副主任、博士生導師，兼任國家督學、教育部基礎教育課程教材專家工作委員會委員、中國教育學會學術委員會委員。
技術發展到今天，「因材施教」如何實現？
王楓：因材施教，我首先到的是，每位學生學習的內容都不一樣。如果有新的技術或者系統，系統應該像一個好老師一樣，不會頭疼醫頭腳疼醫腳。比如說，一元二次方程做錯了，好老師不會簡單說一元二次方程做錯了，你繼續再做十道一元二次方程的題目，這其實是很差的老師，他沒有真正去全面評判學生，到底是哪些掌握好、哪些掌握不好。
一個好的老師可能會說，我全面地看了你整個學習，可能你的問題不是出在一元二次方程上面，老師看了你做的題目，一元一次方程沒有掌握好、因式分解也沒有掌握好，你繼續做一元二次方程是浪費時間。這就是從系統角度來說，系統做到了根據每個學生最基礎的先行知識點的結構，給你提供最適合你當前學習的知識點，題目也好、視頻也好、還有其他各種各樣的學習內容。
胡飛芳：因材施教是我們教育的理想狀態。孔子很早提出因材施教，在他當時的歷史環境裡面，因材施教可能更多是個體性的，因為那時學生少、老師也少，因材施教相對比較容易做到。
隨著歷史的發展，我們有更多的人需要教育時，我們做的一件事情是什麼呢？就是做了一個標准化。標准化做的是什麼？課堂教育。課堂教育從某種意義上來講是標准化。現在這個歷史階段，教育大數據可能真正要做到的就是因材施教，自適應學習本身想做的也是這個。
胡祥恩：因材施教事實上在學習理論里有兩個：一個是outerloop「學什麼」，一個是innerloop「怎麼學」。用技術來細化因材施教是教育產業走向成熟的一個標志。但是這個路非常非常難，因為「怎麼學」那個層次非常非常難。
馬鎮筠：「因材」代表認識到學生的個體化差異，「施教」指進行差異化教學，這是根本思想。但如果考慮到時代背景，孔夫子時代專注的是學生的職業發展方向，也就是說，把適合當政治家的培養成政治家，把適合當學者的培養成學者。現在再提因材施教，我們其實能做得更多、更精細化。
比如，「因材」，對「材」的分類不僅是職業方向，還會考慮到學生的學習狀態、學習目標、潛在能力、興趣偏好等。而且，傳統意義上的因材施教考慮的是學生個體間的差異，沒有重視學生本身狀態是在發生變化的，學生在不斷學習，狀態甚至興趣各方面都可能發生變化。
但這些是自適應學習能夠做到，甚至比傳統的因材施教做得更好的地方。再說到「施教」，現在我們能做的幾件事，包括學習路徑推薦，給不同的學生匹配他最合適的學習內容，這種非常精細化的層面，我們已經有了一定的技術積累。
怎麼判斷一個產品做到了真正的自適應？
馬鎮筠：大多數產品的學習過程可以分為測、學、練，可以從這三個環節去看這個產品做到什麼程度。
測，各種學習機構都有測評。但是國內只有論答團隊第一個做出來能夠在幾十道題內，精準判斷你一百個知識點，哪21個沒掌握，哪79個掌握了。市場上大部分競品，只會告訴你，知識點掌握率或者分數，79分或者知識掌握率達到79%；或者一些其他維度的總結，比如邏輯思維能力比較強、閱讀的磨煉技巧比較好、學習動力哪方面稀缺。他們做了降維，本來很復雜的學習狀態這樣說出來，相對比較容易實現。但如果要做到具體告訴你，哪些知識點掌握、哪些知識點沒掌握，這個難度就高很多了。
關於學習路徑推薦的話，很多題庫類的軟體，知識點學完之後，會給一些題目推薦，但真正實現路徑推薦的很少很少。路徑推薦也是很核心的，有20個知識點沒掌握，先學哪個知識點，後學哪個知識點，學習順序是非常關鍵的，必須遵循循序漸進的原則，哪些知識點是前提知識點，哪些知識點是後續知識點，隨機給你知識點去學習的話不能起到最好效果。真正到了練或學的環節，推薦什麼樣的視頻，先推視頻還是先推文字講義，推簡單題、中等難度題還是復雜題目，都需要根據學生實際情況來決定。
剛才只是舉了幾個例子，具體涉及到背後的演算法、整個系統跟學習內容的結合以及整個教學流程的實現，中間很多環節必須要打通，形成一個閉環，才能對最終的結果負責。
辛濤：我的研究領域是教育和心理學的測量和評價。我個人的學術觀察，基本上在現代這領域是兩個類型。一個是心理測量領域，有一套成熟的方法，包括早期的IRT（Item Response Theory）和現在的ADT。另外一個是人工智慧檢測。心理測量系統，是一小群人在做；人工智慧化是大的方向，現在是顯學，給大家提供了明顯的可能性。重要的是，那些背後的演算法，能夠在企業里真正實現出來。現在可能很多演算法已經在那兒了，大體上路徑是通的。
自適應學習基本上是把學習和評價聯動起來了。因為，要自適應學習，必須有一個系統隨時看到學生學到什麼程度，這個完全是評價。但是，評價完了之後有一個新的呈現。這一塊現在已經有一些很成熟的一些東西了，但不是一時半時可以說得特別具體的。
我做教育的測量和心理測量，人工智慧那塊我不熟。但是，從教育測量角度來說，在自適應學習和新技術結合之前，很大一塊還是自適應考試，CAT（computer adaptive test）。系列化產生一個CAT變成了一個自適應學習的過程。總的來說，使用最簡單、最機械化的方法，連續的CAT實際上是可以破解一個學習過程的。
測評本身經歷了好幾個階段，通常用三個應用介詞表示。
accessment to learning and teaching；
現在國家倡導的，accessment for learning and teaching，測評要對學習和教學有幫助；
跟信息化結合，accessment as learning and teaching，它是學習提供的完全融合的一個環節。
王楓：什麼樣的自適應學習系統才是真正的高級自適應學習系統？在中國的落地到底是怎麼樣才能真正落地？我在馬博士的基礎上想補充一點。
自適應系統如果一定要分級，也可以簡單分一下。一種最基礎的系統是基於規則的，比如說埋點。一個學生做10道一元二次方程題目，我預先埋好了，你做錯了，立馬給你推五道一元一次方程題目、五道因式分解題目。這個是埋點埋好了，這是規則，預先由老師或公式設置好了。
但這個規則有用性是非常有限的，因為每個學生不一樣，A學生是因為一元一次方程不會，B學生可能是因式分解不會，C學生可能連小學的乘法快速運算都不會，這個沒法預先直接埋點准備好。
所以自適應系統真正到了更高級一點的話，一定是真正通過大數據、根據演算法模型來分析學生的學習數據，匹配下一步應該學什麼。
在中國，自適應學習有效應用於教學有三個前提條件。做到這三點，自適應學習在中國的教育裡面前途無限。
好的產品。必須要有針對中國本土化的自適應學習產品，把它開發出來。像ALEKS系統的確演算法不錯，但裡面連一套國內的高考題都沒有，家長不會讓小孩子用這樣的系統，因為直接影響應試目標。真正本土化開發的話，沒有一成不變的演算法，世界上最好演算法就是沒有開發出來的。教育非常復雜，每個學科不一樣。比如數學後台有強大的關系，先行後續關系；英語沒達到數學這么強的相關性，但演算法是一樣可以應用的。
好的學生、家長、老師。有了好的產品，首先學生應該真正投入進去學習。像Ryan Baker教授講的，學生如果隨便學一下，再好的系統也沒用。第二，家長得督促孩子學習。第三，老師非常重要。老師應該做有價值的事情，比如給學生做個性化的輔導答疑，給學生針對性的講解，組織學習活動小組，鼓勵學生發揮創造能力，領導能力的培養。
學校以點帶面。學生大部分時間都在學校裡面學習。如果學校里最基本的、有效的在線教學產品都不應用的話，其實是有問題的。但是改變絕對不是簡單的行政命令可以解決的。一個好的產品，一定是從點到面，逐步推廣。自適應學習，更適合有明確目的的學習，像應試教育這塊可以做得更好。所以學校可以應用進去。
胡祥恩：我覺得大家做自適應也好、因材施教也好，比較好的例子大家可以看一看。教育這個領域有多大，自適應概念就該有多寬。所以說，實驗室裡面有很多小的做得非常非常好的東西，只是沒有到市場上面去，有很多非常非常巧妙的演算法、一些東西。你會發現很多歐洲的、美國的實驗室做的system，我每次看了都有種，自己是坐井觀天的感覺。
怎麼看待人工智慧在教育中的應用？
胡飛芳：AlphaGo跟master，谷歌做了一個非常好的廣告，人工智慧在某些方面可以做得非常好。但是，我現在給你們講另外一個谷歌自己不會去說的例子，但這也是事實。2008年、2009年的時候，谷歌推出一個免費產品，用各種搜集到的數據，預測美國的流感發展趨勢。開始時很成功，預測跟實際發生的情況很相似。但到2015年，他自動撤回去了，不再提供預測。因為在2012跟2013年預測的時候，預測結果跟實際情況相差非常遠。
這說明像這種不確定性的問題，人工智慧還有非常大的局限性。一旦有不確定的數據，就有噪音。數據量很大時，大數據可能產生大噪音。怎樣使噪音下降？2015年一個哈佛教授的研究團隊在谷歌的基礎上，用谷歌的數據去做同樣的預測。他用了什麼呢？就是用了模型，實際上模型在很多時候降噪是很有用的，用模型去預測，而不完全是人工智慧的方式去預測。結果，他做出來的預測基本都比較准。
人工智慧相對比較成功的，是比較確定的問題，所謂的確定是不管有多少種可能性，還是一個確定的東西。而流感很多時候是完全不確定的因素。
教育其實很多時候也是不確定的。同樣一個人，現在讓他回答這個問題，他可能思路清楚地回答出來；過了一個小時後，即使是同樣類型的問題，按道理他應該回答出來，結果他回答不出來。這是說，實際上有很多因素在干擾的時候，人工智慧的功能是不是會減少一點。把模型跟人工智慧加在一起，會彌補人工智慧在某些方面的弱點，這樣會更好。
怎樣促進商界和學界的交流，更好地把學界已經有的一些成果，運用到市場上來？
胡祥恩：教育產業應該是一個最大的產業，教育產業事實上是一個知識產業鏈。到目前為止，很多人認為自己要做一整套系統而在美國汽車業，最賺錢的是供應商，是做輪胎、做玻璃的。一旦標准化之後，一個人如果螺絲釘生產得最好，他就能夠養活幾家人、幾代人。
到目前為止，美國推的就是教育標准化，教育內容的標准化、教育技術的標准化。比如說97年的時候，就說怎麼樣把內容標准化，你做的東西我可以用。我只是做整個教育知識產業鏈裡面一個小塊，做得很好。教育整個的產業鏈，有可能發揮特別特別技巧的那些小的公司，就能夠在這個產業鏈裡面生存、可以做得很好。第一個是要標准化，第二個要理解整個教育是一個產業鏈。

『貳』最近有哪些科技革命

fast射電望遠鏡，嫦娥號火箭探測月球背面。

閱讀全文

人工智慧王楓

與人工智慧王楓相關的閱讀推薦