臺灣本土語言的 Wikidata
條目與詞位建構

王文岳 Allen Wang

Wikidata Taiwan

王文岳

  • Wikidata Taiwan 共同發起人
  • 立法院開放國會第一屆委員
  • 前台灣維基媒體協會秘書長
  • 李梅樹紀念館資訊組召集人
  • 國家文化記憶庫社群經營研究:資訊技術協力

Wikidata 扮演著船連全球網路個平台資料的角色

在維基媒體計畫內部

Wikidata 也扮演著多語言/多計畫資料整合對照

Wikidata 同時是 VIAF 的一份子
提供全球尺度的資料對照與串聯

P

L

Q

Property

屬性

Lexeme

詞意/詞位

 

Item

物件

Wikidata 的主要內容架構

Q

Q

P

P

P

Q

P

P

P

在 Wikidata 裡面我們不再用散文的方式在紀錄資料
而是改變成為單字、片語的方式進行

讓跨語言的資料只需要翻譯單詞或片語
就能用最低的成本做到多語言呈現

trv

tay

szy

中華民國

教育部

教育部

性質

Q697093

P31

Q2269756

Mklawa ttgsa klwaan Cunghwu Minkwo

性質

教育部

Kyo’ikbu

性質

教育部

trv

tay

en

Ministry of Education (R.O.C)

instance of

ministry of education

Wikidata 同時透過「亦稱為」一欄

以及多語言欄位

提供跨語言對照以及權威詞彙對照的功能

樂信·瓦旦

  • 音界號?
    • 樂信·瓦旦? 樂信‧瓦旦?
  • 拼寫不同或是各不同語言
    • Losing Watan 、樂信·瓦旦
  • 不同時期的姓名
    • 渡井三郎、日野三郎

語言欄位連結各語言與各通同名稱

並使用唯一識別碼互相溝通

提供權威對照的功能

亦稱為 欄位同時也可以處理單一語言代碼下

多語言、多部落稱呼不同的問題

Wikidata 目前可用語言
條目、屬性、介面翻譯可用

Wikidata 目前母語標籤可用語言
僅詞位、部分屬性可用

目前 Wikidata 無法使用的語言

目前條目資料數量
(2024)

目前法定原住民 16 族
有 15 個語言代碼(ISO639-3)
42 個語言

寒溪泰雅語(2007-2010)曾被納入

條目或是屬性翻譯

可參閱政府機關提供各本土語言翻譯或是找使用者協助翻譯

詞位 Lexeme

可參照學習詞表對照國際基礎詞表

目前臺灣語言裡面詞位收錄數量前四名

語言代碼共用
可以分開標註

zh

Toda

Truku

Tgdaya

詞位編輯示範

國際可參考 Lexeme Party 推薦詞表

謝謝大家

臺灣本土語言的 Wikidata 條目與詞位建構

By allenwang6212

臺灣本土語言的 Wikidata 條目與詞位建構

  • 99