2015年9月16日 星期三

語言分析:第一周

20150917 第一周

我們這門課會放在語言分析和資料分析的互動,這門學科是需要你去跟上時代,比如說我十年前學習的東西如今已經都用不到,我比較希望是個教練,而不是一個老師。這門課很特殊,倒不是很新的題目,而是沒有一本完整的教科書,你該怎麼學習這樣一門知識?這門課設計不是給資訊相關學門的同學,我的目的就是希望大家零基礎,希望你有不同的專業、興趣、知識,能夠混搭,產生興趣應用,找到自己的強項。

目標--2M2H:Mooc(線上免費課程-自主學習);Make(自造者):一想到就去做,不要去想而已,這是這個時代的精神;Hack(效率改變):不要太執著於建構藍圖,丟出來,大家一起做(學習和思維的方式要改變);Humanities(人文議題):倫理問題、安全問題。現在我們簡單的介紹背景,你活著的時代背景:Data is the KING,每秒鐘大量產生各種不同資料。這難道只有我上網的時候才會留下這麼多資料嗎?似乎也不是如此。比如大家常常聽到的物聯網、車聯網、衣聯網、腦聯網(可能?)......大家先不要有技術門檻的擔心,而是怎麼如何利用自己的興趣和學到的東西,然後找人一起來做。這個時代的精神不是要你十年想出東西來玩的,不是這樣的。你要創造這種想法的時候,絕對不是一個單一學們能夠做出來的。現在是一個協作的時代,一定是集體創作才有可能。你們要越早找到自己厲害的地方。

來談談資料,data,你想想你們很宅,黏在網路上,有網路瀏覽紀錄,走出去,有監視器,消費,有消費紀錄,用手機,有手機定位,甚至還有大陸的支付寶。(另外,微信是多好的training data,它不會中斷,可以拿來訓練電腦分析了解人類的說話)我們這門課在處理symbolic form的data。把數據變成有用的資訊,最終極目標可以整理成知識(data-information-knowledge)。文本數據分析(text analytics)=Statistics+Linguistics(統計學+語言學),那語言學是在做什麼呢?比如你要知道文本哪一段說謊,語言學的某些訓練可以讓你這個sence更強。CS+1,這個1,不是傳統的訓練、規訓,而是讓自己想辦法變成自己想要的專業人才。在提供大家一個訊息,大家可能不相信,哲學系在英國的收入是前五名,因為哲學是基本訓練,再加上專業知識,比別人還要多很多東西。不要用傳統的東西去受限於你看事情的想法、思考你的未來,你這樣子會很吃虧。

文本分類想像力練習,文本分類我假定大家沒有聽過,這是我們之後講課的主題。我講個例子,什麼叫做文本分類,比如說訓練一個分類去,面對p版發文決定要推或噓。分類無所不在。doing by learning,makes your hand dirty。

我不希望有期中考和期末考,但是會有比期中期末更累的東西,就是做一個迷你黑客松,我們就分組,你們多坐在一起,互相學習配合,期中考後兩周會來這樣的活動,那天我會給大家一個題目和資料,大家去設想、討論、分析。第十七周,做一個最厲害的project,可以很開放,一個點子,想辦法實作,驚艷我們。我會請新創公司的CEO來替你們評分。期末的分數非常重要。這個課包括期中期末,就是你的團隊(團隊精神、默契,如果只是隨便聚合,不知道別人厲害在哪裡)。Key word:你要不要和我們一起來創造東西?如果你沒有熱情、動機,你就會玩不好,面對這個變動的時代,那些不能與人合作的人,恐怕也不會活得太好。


沒有留言:

張貼留言