『壹』 「人工智慧」,「大數據」+教育如何驅動教育的未來

近日,由論答公司主辦的教育大數據研討會在北京舉行,討論會主題為「大數據+教育,有哪些可能性?」。本次研討會主要關注數據在教育領域的應用,具體包括自適應學習、學習數據分析和教育數據挖掘。來自賓夕法尼亞大學、人民大學、華中師范大學的專家和企業界代表,共同探討了教育大數據和自適應學習領域的技術趨勢和產業機會
Ryan Baker是國際教育數據挖掘協會(International Ecational Data Mining Society)的創始人、《教育數據挖掘》雜志(Journal Ecational Data Mining)主編,在各類期刊和會議發表了260餘篇學術論文,先後主持了美國科學基金會(National Science Foundation)、蓋茨基金會(Gates Foundation)等研究基金的多項重大項目,累計獲得研究經費超過1600萬美元。
他也在哥倫比亞大學教育學院和愛丁堡大學同時擔任教職,他在Coursera和edX上開設的「Big Data in Ecation(教育大數據)」課程,有來自100多個國家和地區的學生注冊。
研討會現場,Ryan Baker通過遠程視頻,分享了他對教育大數據的體驗和應用。據他介紹,目前在教育大數據領域主要有四大研究組織,分別研究人工智慧與教育、教育數據挖掘、學習數據分析和大規模學習。
Ryan Baker表示,在教育領域廣泛應用大數據的時代正在到來。教育數據挖掘有很多的應用方向,包括:預測學生是會輟學,還是會成功完成學業;自動檢測學生的學習投入程度、情感、學習策略,以更好地達到個性化;給教師和其他相關人員提供更好的報告;教育科學的基礎研究和發現。
他認為,個性化教育至少要做到三件事情:
1、確定學生的有關數據;
2、了解對於學生的學習來說什麼是真正重要的;
3、有針對性地為學生提供合適的教學。
而通過教育數據挖掘,我們可以推斷很多事情:
學生的元認知和求助。比如,這個學生有多自信?當他需要幫助時,有沒有在尋求幫助?他有沒有在給自己解釋問題,有沒有思考這個答案是正確的還是錯誤的?最重要的,當他面臨挑戰時,能否堅持下去?
沒有投入學習的行為。比如,「玩弄」系統,為了找到正確的答案,有的學生會試各種不同的答案,從「1」試到「38」。粗心,本身會做,但是不用心,最後給出的答案是錯的。有些孩子會做非常難以解釋的行為,比如不用方程符號,而是畫了一個笑臉。
學生情感。Baker的研究團隊和其他研究團隊,已經創造了研究模型,可以根據數據推斷,學生是否感到厭倦、沮喪、困惑、好奇、興奮、快樂,是否投入,等等。
長期的學習結果。比如,學生能夠記住剛才他學的東西嗎?學生准備好學習下一個主題、下一個知識沒有?中學生能上大學嗎?他會從大學畢業還是輟學?
Ryan Baker表示,要獲得這樣的推斷,只需要學生與系統交互的數據,不需要學生戴上頭盔檢測器。目前,這些模型已經開始大規模應用於自適應學習,應用於幾十萬的美國學生。Ryan Baker列舉了一些自適應學習系統的案例。
Knewton
通過系統決定學生下一個要學習的問題是什麼,已在全球的多個領域多個學科中運用。
ALEKS-ALEKS
用的是先行知識結構和知識點模型,來選擇最適合學生的學習材料。比如,一個學生在學習上出現了問題,系統能夠檢測出來,是以前學的知識點出了問題,然後讓學生回到以前的知識點上去學習。ALEKS系統應用於美國高中、大學的數學、科學學科。
Cognitive Tutor
系統能自動檢測學生的知識,直到學生掌握為止。比如,系統不會讓學生學習下一步的知識,直到他展示出他已經學好了他現在正在學習的知識。系統能夠給學校提供數據報告,學校根據報告能夠更好地讓學生投入到學習中去。每年大約被50萬的美國初高中生用於數學學習。
論答
論答公司的系統與ALEKS的系統有些類似,也是用先行結構和知識點模型,選擇合適的學習材料。同時也是自動檢測學生的知識狀態直到學生掌握為止。應用領域目前包括數學和英語,完全針對中國學生開發
Reasoning Mind
用各種自動檢測的模型來檢測老師的教學是否有效。通過數據生成報告給每個地區的教學管理員,讓他們找到方法幫助老師提高教學。主要是用於美國的小學數學。
Duolingo
自動檢測學生記憶,來決定什麼時候回顧已經學過的知識。在全世界范圍內應用於外語詞彙的學習。
其他的像Civitas,Course Signals,Zogotech都是地區供應商,運用風險預測模型提供行動信息預測。它們會對學生做出預測,可能學不好、會失敗,把報告提供給老師。已在世界范圍內的大學應用。
Ryan Baker指出,在這些系統中,有足夠的證據證明,至少以下兩個系統是非常好的。
1、胡祥恩教授在美國做了大量實證研究,證明ALEKS系統對於幫助學生學習是有效的。他的研究證明,ALEKS系統對於不同人群的學生是同樣有效的;特別值得提出的是,ALEKS可以幫助少數人群群體提高學習成績。
2、Ryan Baker本人領導的研究團隊與論答公司合作的研究表明,學生通過論答系統學習,比通過傳統的在線學習系統學習,效果更好。他們在中國3個不同的地區做的3次實證研究,都證明了論答系統的有效性。
Ryan Baker分析了教育大數據演算法模型的潛在發展方向。他認為,這些模型的長期潛力是,通過學生的知識和學習模型來確認,學生什麼時候需要更多的支持:
首先是「mastery learning」,學生在掌握一個知識前,不會讓他去學習下一個知識。當學生需要支持的時候,自動介入;同時告訴老師和父母,這個學生什麼時候需要支持。
通過學習投入程度模型判斷,學生什麼時候開始變得厭倦、沮喪了,並調整學習活動,讓厭倦的學生不再厭倦,讓沮喪的學生的學習變得更容易一些。
學習投入程度模型還可以檢測,在線學習中,什麼樣的學習活動,能讓學生更容易地投入進去,並最終發現,什麼樣的學習活動對學生更好、對什麼樣的學生更好。
這樣的模型也能告訴老師和父母,學生什麼時候開始變得不再投入學習了。
還可以運用學習模型確認,學生什麼時候沒有真正學會,需要更多支持。
最後,Ryan Baker指出,下一步的目標是優化之前已經驗證的經驗和方法,然後把它們運用到系統中,最終讓中國和世界上的數十億學生受益。
討論:「因材施教」的千年理想該如何照進現實?
王楓博士,論答公司(Learnta Inc.)創始人兼CEO
胡飛芳博士,美國喬治華盛頓大學(George Washington University)統計學終身教授,中國人民大學統計與大數據研究院的教授
胡祥恩博士,美國孟菲斯大學(University of Memphis)心理系、計算機科學系、計算機工程系終身教授,華中師范大學心理學院院長
馬鎮筠博士,論答公司聯合創始人兼首席數據科學家
辛濤博士,北京師范大學中國基礎教育質量監測協同創新中心常務副主任、博士生導師,兼任國家督學、教育部基礎教育課程教材專家工作委員會委員、中國教育學會學術委員會委員。
技術發展到今天,「因材施教」如何實現?
王楓:因材施教,我首先到的是,每位學生學習的內容都不一樣。如果有新的技術或者系統,系統應該像一個好老師一樣,不會頭疼醫頭腳疼醫腳。比如說,一元二次方程做錯了,好老師不會簡單說一元二次方程做錯了,你繼續再做十道一元二次方程的題目,這其實是很差的老師,他沒有真正去全面評判學生,到底是哪些掌握好、哪些掌握不好。
一個好的老師可能會說,我全面地看了你整個學習,可能你的問題不是出在一元二次方程上面,老師看了你做的題目,一元一次方程沒有掌握好、因式分解也沒有掌握好,你繼續做一元二次方程是浪費時間。這就是從系統角度來說,系統做到了根據每個學生最基礎的先行知識點的結構,給你提供最適合你當前學習的知識點,題目也好、視頻也好、還有其他各種各樣的學習內容。
胡飛芳:因材施教是我們教育的理想狀態。孔子很早提出因材施教,在他當時的歷史環境裡面,因材施教可能更多是個體性的,因為那時學生少、老師也少,因材施教相對比較容易做到。
隨著歷史的發展,我們有更多的人需要教育時,我們做的一件事情是什麼呢?就是做了一個標准化。標准化做的是什麼?課堂教育。課堂教育從某種意義上來講是標准化。現在這個歷史階段,教育大數據可能真正要做到的就是因材施教,自適應學習本身想做的也是這個。
胡祥恩:因材施教事實上在學習理論里有兩個:一個是outerloop「學什麼」,一個是innerloop「怎麼學」。用技術來細化因材施教是教育產業走向成熟的一個標志。但是這個路非常非常難,因為「怎麼學」那個層次非常非常難。
馬鎮筠:「因材」代表認識到學生的個體化差異,「施教」指進行差異化教學,這是根本思想。但如果考慮到時代背景,孔夫子時代專注的是學生的職業發展方向,也就是說,把適合當政治家的培養成政治家,把適合當學者的培養成學者。現在再提因材施教,我們其實能做得更多、更精細化。
比如,「因材」,對「材」的分類不僅是職業方向,還會考慮到學生的學習狀態、學習目標、潛在能力、興趣偏好等。而且,傳統意義上的因材施教考慮的是學生個體間的差異,沒有重視學生本身狀態是在發生變化的,學生在不斷學習,狀態甚至興趣各方面都可能發生變化。
但這些是自適應學習能夠做到,甚至比傳統的因材施教做得更好的地方。再說到「施教」,現在我們能做的幾件事,包括學習路徑推薦,給不同的學生匹配他最合適的學習內容,這種非常精細化的層面,我們已經有了一定的技術積累。
怎麼判斷一個產品做到了真正的自適應?
馬鎮筠:大多數產品的學習過程可以分為測、學、練,可以從這三個環節去看這個產品做到什麼程度。
測,各種學習機構都有測評。但是國內只有論答團隊第一個做出來能夠在幾十道題內,精準判斷你一百個知識點,哪21個沒掌握,哪79個掌握了。市場上大部分競品,只會告訴你,知識點掌握率或者分數,79分或者知識掌握率達到79%;或者一些其他維度的總結,比如邏輯思維能力比較強、閱讀的磨煉技巧比較好、學習動力哪方面稀缺。他們做了降維,本來很復雜的學習狀態這樣說出來,相對比較容易實現。但如果要做到具體告訴你,哪些知識點掌握、哪些知識點沒掌握,這個難度就高很多了。
關於學習路徑推薦的話,很多題庫類的軟體,知識點學完之後,會給一些題目推薦,但真正實現路徑推薦的很少很少。路徑推薦也是很核心的,有20個知識點沒掌握,先學哪個知識點,後學哪個知識點,學習順序是非常關鍵的,必須遵循循序漸進的原則,哪些知識點是前提知識點,哪些知識點是後續知識點,隨機給你知識點去學習的話不能起到最好效果。真正到了練或學的環節,推薦什麼樣的視頻,先推視頻還是先推文字講義,推簡單題、中等難度題還是復雜題目,都需要根據學生實際情況來決定。
剛才只是舉了幾個例子,具體涉及到背後的演算法、整個系統跟學習內容的結合以及整個教學流程的實現,中間很多環節必須要打通,形成一個閉環,才能對最終的結果負責。
辛濤:我的研究領域是教育和心理學的測量和評價。我個人的學術觀察,基本上在現代這領域是兩個類型。一個是心理測量領域,有一套成熟的方法,包括早期的IRT(Item Response Theory)和現在的ADT。另外一個是人工智慧檢測。心理測量系統,是一小群人在做;人工智慧化是大的方向,現在是顯學,給大家提供了明顯的可能性。重要的是,那些背後的演算法,能夠在企業里真正實現出來。現在可能很多演算法已經在那兒了,大體上路徑是通的。
自適應學習基本上是把學習和評價聯動起來了。因為,要自適應學習,必須有一個系統隨時看到學生學到什麼程度,這個完全是評價。但是,評價完了之後有一個新的呈現。這一塊現在已經有一些很成熟的一些東西了,但不是一時半時可以說得特別具體的。
我做教育的測量和心理測量,人工智慧那塊我不熟。但是,從教育測量角度來說,在自適應學習和新技術結合之前,很大一塊還是自適應考試,CAT(computer adaptive test)。系列化產生一個CAT變成了一個自適應學習的過程。總的來說,使用最簡單、最機械化的方法,連續的CAT實際上是可以破解一個學習過程的。
測評本身經歷了好幾個階段,通常用三個應用介詞表示。
accessment to learning and teaching;
現在國家倡導的,accessment for learning and teaching,測評要對學習和教學有幫助;
跟信息化結合,accessment as learning and teaching,它是學習提供的完全融合的一個環節。
王楓:什麼樣的自適應學習系統才是真正的高級自適應學習系統?在中國的落地到底是怎麼樣才能真正落地?我在馬博士的基礎上想補充一點。
自適應系統如果一定要分級,也可以簡單分一下。一種最基礎的系統是基於規則的,比如說埋點。一個學生做10道一元二次方程題目,我預先埋好了,你做錯了,立馬給你推五道一元一次方程題目、五道因式分解題目。這個是埋點埋好了,這是規則,預先由老師或公式設置好了。
但這個規則有用性是非常有限的,因為每個學生不一樣,A學生是因為一元一次方程不會,B學生可能是因式分解不會,C學生可能連小學的乘法快速運算都不會,這個沒法預先直接埋點准備好。
所以自適應系統真正到了更高級一點的話,一定是真正通過大數據、根據演算法模型來分析學生的學習數據,匹配下一步應該學什麼。
在中國,自適應學習有效應用於教學有三個前提條件。做到這三點,自適應學習在中國的教育裡面前途無限。
好的產品。必須要有針對中國本土化的自適應學習產品,把它開發出來。像ALEKS系統的確演算法不錯,但裡面連一套國內的高考題都沒有,家長不會讓小孩子用這樣的系統,因為直接影響應試目標。真正本土化開發的話,沒有一成不變的演算法,世界上最好演算法就是沒有開發出來的。教育非常復雜,每個學科不一樣。比如數學後台有強大的關系,先行後續關系;英語沒達到數學這么強的相關性,但演算法是一樣可以應用的。
好的學生、家長、老師。有了好的產品,首先學生應該真正投入進去學習。像Ryan Baker教授講的,學生如果隨便學一下,再好的系統也沒用。第二,家長得督促孩子學習。第三,老師非常重要。老師應該做有價值的事情,比如給學生做個性化的輔導答疑,給學生針對性的講解,組織學習活動小組,鼓勵學生發揮創造能力,領導能力的培養。
學校以點帶面。學生大部分時間都在學校裡面學習。如果學校里最基本的、有效的在線教學產品都不應用的話,其實是有問題的。但是改變絕對不是簡單的行政命令可以解決的。一個好的產品,一定是從點到面,逐步推廣。自適應學習,更適合有明確目的的學習,像應試教育這塊可以做得更好。所以學校可以應用進去。
胡祥恩:我覺得大家做自適應也好、因材施教也好,比較好的例子大家可以看一看。教育這個領域有多大,自適應概念就該有多寬。所以說,實驗室裡面有很多小的做得非常非常好的東西,只是沒有到市場上面去,有很多非常非常巧妙的演算法、一些東西。你會發現很多歐洲的、美國的實驗室做的system,我每次看了都有種,自己是坐井觀天的感覺。
怎麼看待人工智慧在教育中的應用?
胡飛芳:AlphaGo跟master,谷歌做了一個非常好的廣告,人工智慧在某些方面可以做得非常好。但是,我現在給你們講另外一個谷歌自己不會去說的例子,但這也是事實。2008年、2009年的時候,谷歌推出一個免費產品,用各種搜集到的數據,預測美國的流感發展趨勢。開始時很成功,預測跟實際發生的情況很相似。但到2015年,他自動撤回去了,不再提供預測。因為在2012跟2013年預測的時候,預測結果跟實際情況相差非常遠。
這說明像這種不確定性的問題,人工智慧還有非常大的局限性。一旦有不確定的數據,就有噪音。數據量很大時,大數據可能產生大噪音。怎樣使噪音下降?2015年一個哈佛教授的研究團隊在谷歌的基礎上,用谷歌的數據去做同樣的預測。他用了什麼呢?就是用了模型,實際上模型在很多時候降噪是很有用的,用模型去預測,而不完全是人工智慧的方式去預測。結果,他做出來的預測基本都比較准。
人工智慧相對比較成功的,是比較確定的問題,所謂的確定是不管有多少種可能性,還是一個確定的東西。而流感很多時候是完全不確定的因素。
教育其實很多時候也是不確定的。同樣一個人,現在讓他回答這個問題,他可能思路清楚地回答出來;過了一個小時後,即使是同樣類型的問題,按道理他應該回答出來,結果他回答不出來。這是說,實際上有很多因素在干擾的時候,人工智慧的功能是不是會減少一點。把模型跟人工智慧加在一起,會彌補人工智慧在某些方面的弱點,這樣會更好。
怎樣促進商界和學界的交流,更好地把學界已經有的一些成果,運用到市場上來?
胡祥恩:教育產業應該是一個最大的產業,教育產業事實上是一個知識產業鏈。到目前為止,很多人認為自己要做一整套系統而在美國汽車業,最賺錢的是供應商,是做輪胎、做玻璃的。一旦標准化之後,一個人如果螺絲釘生產得最好,他就能夠養活幾家人、幾代人。
到目前為止,美國推的就是教育標准化,教育內容的標准化、教育技術的標准化。比如說97年的時候,就說怎麼樣把內容標准化,你做的東西我可以用。我只是做整個教育知識產業鏈裡面一個小塊,做得很好。教育整個的產業鏈,有可能發揮特別特別技巧的那些小的公司,就能夠在這個產業鏈裡面生存、可以做得很好。第一個是要標准化,第二個要理解整個教育是一個產業鏈。

『貳』 最近有哪些科技革命

fast射電望遠鏡,嫦娥號火箭探測月球背面。