學習課程:
壹:計算機科學
計算機科學與編程導論(使用Python)
計算機系統工程:本課程涵蓋與計算機軟件和硬件系統工程以及控制復雜性的技術相關的主題;采用客戶機-服務器設計,強大的虛擬內存和線程模塊化;網絡;並行活動的原子性和協調性;恢復和可靠性;隱私、安全和加密;以及計算機系統對社會的影響。
數字系統工程導論。這門課程從MOS晶體管開始,發展了壹系列的元件——邏輯門、組合電路和時序電路、有限狀態機、計算機,最後是壹個完整的系統(包括硬件和軟件)。
算法介紹:涵蓋了常用算法、算法實例和用於解決計算問題的數據結構。
人工智能:本課程向學生介紹人工智能的基本知識表示、問題解決方法和學習方法。
用C/C ++/Java進行面向對象編程
二:數理統計
應用數學:計算機科學與工程離散數學導論。
概率統計導論(使用R編程):本課程給出了概率統計在應用中的基本介紹。主題包括:隨機變量,概率分布,貝葉斯推理,假設檢驗,置信區間和線性回歸。
線性代數(使用R編程或其他數學工具):本課程涵蓋矩陣理論和線性代數。
統計學/機器學習(使用R編程):介紹數據分析的核心算法,如線性和非線性回歸的類型,分類技術,如logistic回歸,樸素貝葉斯,SVM,決策樹(香草決策樹,隨機森林,增強),無監督學習方法(如聚類,引入神經網絡)。
高級機器學習(用Python編程):為對人工智能有濃厚興趣、專註於圖像/文本處理的學生設計的神經網絡。
第三:領域專長
理想情況下,這些應該基於工作興趣/領域,以便每個學生可以選擇壹個特殊的領域(例如,Web開發、移動應用程序開發、數據分析、營銷分析、供應鏈、金融、制造等。).
數據分析課程的核心主題應該是:
數據收集和清理:這應該包括使用開源工具(比如Python/R)從互聯網上抓取數據並連接到數據庫。此外,數據清理和ETL概念(如重復數據刪除、合並和丟失數據估計技術無法創建)分析數據集。
數據可視化和報告:使用SAS/SAP或R/Python等工具創建BI dashboard,並通過可視化和數據故事演示來顯示見解和分析數據。
數據分析應用1/2:以業務為中心,完成端到端的數據分析項目。這個主題在過去幾年裏應該重復兩次。連接到實際的數據庫並在生產中部署模型應該是非常重要的,而不僅僅是靜態數據集的臨時數據分析。
高級數據計算:這裏的學生應該使用開源和專有工具(如Hadoop/Spark、HANA或其他MPP數據庫)來創建具有大規模數據分析的項目。
延伸閱讀:
它還將包括以下內容:
1.網絡工程基礎。原因:畢業生應該了解計算機網絡,以便在必要的時候與他們合作,管理他們,改善組織的網絡和數據架構。主題包括:網絡工程、數據庫、數據倉庫。
2.研究方法:能夠使用定量和定性方法以系統的方式設計項目,從提出假設到提出商業建議。
3.非結構化數據分析:學生應了解文本挖掘、自然語言處理、社交媒體挖掘、網絡挖掘等應用的基礎知識。這些也可以采取選修課的形式。
需要註意的是,優秀的數據分析師和商業智能並不關註工具。理想情況下,教授任何工具(R/SAS/SAP/Python/其他)作為數據分析理論概念的補充。比如用統計學和概率進行R編程。用於神經網絡和其他機器學習任務的Python。具有數據可視化和數據報告概念的SAS VA或SAP Lumira。具有數據庫概念的SQL等。這是壹個缺乏很多新的數據分析程序的領域,所以導致的結果就是畢業生只是應用開發者或者用戶,無法解決現實世界的問題。