Wikidata 中的原住民族語現況
王文岳 Allen Wang
Wikidata Taiwan
以阿美語為例
王文岳
- Wikidata Taiwan 共同發起人
- 立法院開放國會第一屆委員
- 前台灣維基媒體協會秘書長
- 李梅樹紀念館資訊組召集人
- 國家文化記憶庫社群經營研究:資訊技術協力

Wikidata 扮演著串連全球網路各平台資料的角色

在維基媒體計畫內部
Wikidata 也扮演著多語言/多計畫資料整合對照

Wikidata 同時是 VIAF 的一份子
提供全球尺度的資料對照與串聯
P
L
Q
Property
屬性
Lexeme
詞意/詞位
Item
物件
Wikidata 的主要內容架構
Q
Q
P
P
P
Q
P
P
P
在 Wikidata 裡面我們不再用散文的方式在紀錄資料
而是改變成為單字、片語的方式進行
讓跨語言的資料只需要翻譯單詞或片語
就能用最低的成本做到多語言呈現


trv
tay

szy
中華民國
教育部
教育部
性質
Q697093
P31
Q2269756
Ciyaw-i-pu
性質
教育部
Kyo’ikbu
性質
教育部
ami
tay
en
Ministry of Education (R.O.C)
instance of
ministry of education


Wikidata 同時透過「亦稱為」一欄
以及多語言欄位
提供跨語言對照以及權威詞彙對照的功能
樂信·瓦旦
- 音界號?
- 樂信·瓦旦? 樂信‧瓦旦?
- 拼寫不同或是各不同語言
- Losing Watan 、樂信·瓦旦
- 不同時期的姓名
- 渡井三郎、日野三郎
語言欄位連結各語言與各通同名稱
並使用唯一識別碼互相溝通
提供權威對照的功能

亦稱為 欄位同時也可以處理單一語言代碼下
多語言、多部落稱呼不同的問題


Wikidata 目前可用語言
條目、屬性、介面翻譯可用

Wikidata 目前母語標籤可用語言
僅詞位、部分屬性可用

目前 Wikidata 無法使用的語言


目前條目資料數量
(2024)

阿美語詞位收錄現況

維基媒體政策頁面、教學頁面翻譯
條目或是屬性翻譯
詞位 Lexeme
可參照學習詞表對照國際基礎詞表



目前臺灣語言裡面詞位收錄數量前四名


語言代碼共用
可以分開標註

多語言橫向對照詞義
earthquake L31985-S1



zh
Toda
Truku
Tgdaya


詞位編輯示範


國際可參考 Lexeme Party 推薦詞表
謝謝大家
Wikidata 中的原住民族語現況 - 以阿美語為例
By allenwang6212
Wikidata 中的原住民族語現況 - 以阿美語為例
- 101