陽光百科遷移計劃
目錄
時間線
- 7月25日導入標準頁面(課程總結、課程提綱、學生課堂表現)
- 7月28日導入非標準頁面
- 7月30日界面調試完畢
- 7月31日舊百科進入只讀模式,www.ygclub.org/wiki指向新百科
待完成任務列表
- 導入總結帖、助教總結、學生課堂表現
- 總結帖、助教反饋、學生表現關聯
- 非標準頁面導入
- 圖像的導入
- 不同課程用不同的logo
- 一個定製的皮膚( http://www.mediawiki.org/wiki/Manual:Gallery_of_user_styles)
- 導入層級類目體系
- 採用類目體系來組織多次上過的課程和正在開發的課程
互動百科導入維基百科數據的關鍵點
互動百科的數據格式:html
互動百科的數據格式保存的形式是html,在資料庫中位於表wiki_doc中
其中,我們需要title, tags, summary和content。
而content裡面的內容是html格式,mediawiki對其並非完全支持,我們需要對它進行處理。
維基百科的數據格式:wiki markup
維基源代碼的格式點擊本頁右上角編輯源代碼可以看到。
維基百科的數據格式和html部分相容
比如如下一段話,源代碼其實是比較負責的html,但是維基仍然可以比較好的解析:
A hunting we will go, a hunting we will go,
Heigh ho, the dairy-o, a hunting we will go!
A hunting we will go, a hunting we will go,
We'll catch a fox and put him in a box,
And then we'll let him go!
A hunting we will go, a hunting we will go,
Heigh ho, the dairy-o, a hunting we will go!
A hunting we will go, a hunting we will go,
We'll catch a fish and put him on a dish,
And then we'll let him go!
A hunting we will go, a hunting we will go,
Heigh ho, the dairy-o, a hunting we will go!
A hunting we will go, a hunting we will go,
We'll catch a bear and cut his hair,
And then we'll let him go!
A hunting we will go, a hunting we will go,
Heigh ho, the dairy-o, a hunting we will go!
A hunting we will go, a hunting we will go,
We'll catch a pig and dance a little jig,
And then we'll let him go!
A hunting we will go, a hunting we will go,
Heigh ho, the dairy-o, a hunting we will go!
A hunting we will go, a hunting we will go,
We'll catch a giraffe and make him laugh,
And then we'll let him go!
維基百科的圖片和鏈接與html不相容
當出現鏈接和圖片的時候,需要進行轉換才能正常顯示。 也就是<img>標籤以及<a>標籤,維基百科是不支持的。
- <img>標籤的處理,維基百科支持的是直接輸入圖片的鏈接地址,比如
- <a> 標籤的處理,維基百科支持的如下的語法 鏈接
hdwiki和mediawiki表格嚴重不兼容
表格需要另外想辦法處理,兩邊非常不兼容,所以陽光百科的課程總結、上課準備提綱都有專門的程序轉換,這裡只考慮非標準頁面(不是課程提綱、總結、學生課堂表現)的頁面。
還有一些其他問題待補充
理想的效果
針對每一個hdwiki的頁面(現在大概800個),都生成一個對應的wiki markup的文本文件。