...

IBM Watson LATCH

by user

on
Category: Documents
5

views

Report

Comments

Transcript

IBM Watson LATCH
2
Natural Language Processing
IBM “Watson”
Watson
J
Jeopardy!
d !
IBM
2011/2/17
2
2880
https://www.youtube.com/watch?v=KVM6KKRa12g
LATCH:
1. Loca
2. Alphabet
3. Time
4. Category
5. Hierarchy
50
ศ㢮䛾₇⩦
䛺䛩䚸᪂⪺䚸䜋䛖䛝䚸䜻䜹䜲䝎 䚸䛻䜟䛸䜚䚸
䛺䛩䚸᪂⪺䚸䜋䛖䛝䚸䜻䜹䜲䝎͸䚸䛻䜟䛸䜚䚸
ศ㢮䛾₇⩦
䝸䞁䝂䚸Ꮫ⏕䚸䛔䛩䚸䝖䝬䝖䚸䝁䞁䝢䝳䞊䝍䚸
䝢䝷䝙䜰䚸䝔䝺䝡䚸ᤲ㝖ᶵ䚸䛟䛨䜙
±
±
䜴䜱䝖䝀䞁䝅䝳䝍䜲䞁䠄1989 1951䠅
䜴䜱䝖䝀䞁䝅䝳䝍䜲䞁䠄1989Ͳ1951䠅
ᐙ᪘ⓗ㢮ఝᛶ
どⅬ䡡ほⅬ
䝀䞊䝮
䝀
䝮
䝏䜵䝇
䝖䝷䞁䝥
ᗙ䛳䛶䜔䜛
ศ㢮䛿䚸どⅬ䡡ほⅬ䛻䜘䛳䛶␗䛺䜛
༟⌫
䝂䝹䝣
䝪 䝹䜢౑䛖
䝪䞊䝹䜢౑䛖
䠍ᑐ䠍
ᑐ
ከேᩘྍ
±
ゝⴥ ᩥ໬䛸䛾㛵ಀ
ゝⴥ䚸ᩥ໬䛸䛾㛵ಀ
±
䜸䞊䝞䞊䝌䞊䝙䞁䜾
‡ ゝⴥяᴫᛕ
ⴥ ᴫᛕ
‡ ⓒ㈌ᗑ䛾኎䜚ሙ
㈌ᗑ ኎ ሙ
± ᒣ 䠖 㧗䛟䜒䜚䛒
㧗䛟䜒䜚䛒䛜䛳䛯ᆅᙧ
䛯ᆅᙧ
± ᖹ㔝 䠖 䛯䛔䜙䛻ᗈ䛜䛳䛯ᆅᙧ
±ୣ 䠖 䠛
± ᆅୗ䠖㣗ရ䚸䠍㝵䠖໬⢝ရ䚸䠎㝵䠖ὒ᭹
ᆅୗ 㣗ရ䚸 㝵 ໬⢝ရ䚸 㝵 ὒ᭹
䠏㝵䠖䝇䝫䞊䝒⏝ရ䚸…
‡ 䜸䞊䝞䞊䝌䞊䝙䞁䜾
‡ ᩥ໬
± 䝇䜻䞊䛾኎䜚ሙ䠖䝇䜻䞊⏝ရ䚸䝒䜰䞊ண⣙䚸
䝏䜵䞊䞁䚸㐨㊰ᆅᅗ䚸೺ᗣ㣧ᩱ䚸…
± 䝗䜲䝒䛷䛿䝖䝬䝖䛿ᯝ≀
± ᪥ᮏ䛷䛾㨶䛾⣽䛛䛔ྡ๓
±
±
Uppsala, Sweden
vs.
vs
ᩘ㔞ศ㢮Ꮫ
≉ᚩ䝧䜽䝖䝹
‡ ≉ᚩ䝧䜽䝖䝹䠄ᒓᛶ䛾᮰䠅䛷ಶయ䜢⾲⌧
≉ᚩ䝧
ᛶ ᮰ ಶయ䜢⾲
ᒓᛶ
‡ ಶయ㛫䛾㢮ఝᗘ䠙≉ᚩ䝧䜽䝖䝹䛾㢮ఝᗘ
± ୍⮴ಀᩘ䚸䝴䞊䜽䝸䝑䝗㊥㞳䚸ゅᗘ
ಶయ
‡ 䜽䝷䝇䝍ศᯒ
± 㢮ఝᗘ䛾㧗䛔䜒䛾䜢䜎䛸䜑䜛
㢮ఝᗘ 㧗 䜒 䜢䜎䛸䜑䜛
㻭
㻮
㻯
㻰
㻱
㼒㻝
㻜
㻝
㻜
㻝
㻜
㼒㻞
㻝
㻜
㻝
㻜
㻝
㼒㻟
㻜
㻝
㻜
㻝
㻜
㼒㻠
㻜
㻝
㻝
㻜
㻝
㼒㻡
㻝
㻝
㻜
㻜
㻝
±
±
㢮ఝᗘ䠄 ⮴ಀᩘ䠅
㢮ఝᗘ䠄୍⮴ಀᩘ䠅
㻭
㻝
㻮
㻝㻛㻢
㻝
㻯
㻟㻛㻢
㻞㻛㻢
㻝
㻰
㻞㻛㻢
㻟㻛㻢
㻝㻛㻢
㻝
䜽䝷䝇䝍䞊ศᯒ
㻱
㻡㻛㻢
㻞㻛㻢
㻠㻛㻢
㻝㻛㻢
㻝
ᶞᙧᅗ
㻭
㻮
㻯
㻰
㻱
㼒㻢
㻝
㻜
㻜
㻝
㻝
䠝 䠡 䠟
䠞
䠠
±
±
ᅗ᭩㤋䛾Ṕྐ
‡ ྂ௦
ྂ
± 䜰䝺䜻䝃䞁䝗䝸䜰ᅗ᭩㤋䚸ⶶ᭩┠㘓
䜰 䜻䝃䞁 䝸䜰ᅗ᭩㤋䚸ⶶ᭩┠㘓
‡ ୰ୡ
ᅗ᭩䛾ศ㢮
± ಟ㐨㝔䜔ᩍ఍䛾ᅗ᭩㤋
± ᩘⓒ䛛䜙䠎䠌䠌䠌෉⛬ᗘ
‡ 䝹䝛䝑䝃䞁䝇௨㝆
± ኱Ꮫ䚸Ꮫၥศ㔝䚸୺㢟䛻䜘䜛ศ㢮
኱Ꮫ Ꮫၥศ㔝 ୺㢟䛻䜘䜛ศ㢮
±
±
ᅗ᭩㤋䛾Ṕྐ
ᅗ᭩䛾ศ㢮
‡ 䠍䠔ୡ⣖
ୡ⣖
‡ ᭩ᯫศ㢮
± ᩍ⫱䚸୰⏘㝵⣭
± ఍ဨไᅗ᭩㤋䚸㈚ᮏᒇ
± ᅗ᭩㤋䛾Ჴ䛾䛹䛣䛻ఱ䜢䛚䛟䛛
ᅗ᭩㤋 Ჴ
ఱ䜢䛚䛟
‡ ᭩ㄅศ㢮
‡ 䠍䠕ୡ⣖䡚
䠍䠕ୡ⣖
± ᭩ㄅ᝟ሗ䠄䝍䜲䝖䝹䚸ⴭ⪅ྡ䚸୺㢟➼䠅䛾ศ㢮
᭩ㄅ᝟ሗ䠄䝍䜲䝖䝹 ⴭ⪅ྡ ୺㢟➼䠅䛾ศ㢮
± ୺㢟䛾ศ㢮䜢タᐃ
± 䛭䛣䜈ྛᅗ᭩䜢ᑐᛂ௜䛡䜛
± බඹᅗ᭩㤋
± ༑㐍ศ㢮ἲ䚸䝁䝻䞁ศ㢮ἲ
±
±
䝁䝻䞁ศ㢮ἲ
༑㐍ศ㢮ἲ䠄䝕䝳䞊䜲䚸ᅜ㝿䚸᪥ᮏ䠅
㐍 㢮
䝕
㝿
ᮏ
䠌䠌䠌
䠍䠌䠌
䠎䠌䠌
䠏䠌䠌
䠐䠌䠌
䠑䠌䠌
䠒䠌䠌
䠓䠌䠌
䠔䠌䠌
䠕䠌䠌
⥲グ
ဴᏛ䛸ᚰ⌮Ꮫ
᐀ᩍ
♫఍⛉Ꮫ
ゝㄒ
⮬↛⛉Ꮫ䛸ᩘᏛ
ᢏ⾡䠄ᛂ⏝⛉Ꮫ䠅
ⱁ⾡
ᩥᏛ䛸ಟ㎡Ꮫ
ᆅ⌮Ꮫ䛸Ṕྐ
䠓䠌䠌
䠓䠍䠌
䠓䠎䠌
䠓䠏䠌
䠓䠐䠌
䠓䠑䠌
䠓䠒䠌
䠓䠓䠌
䠓䠔䠌
䠓䠕䠌
ⱁ⾡
⏕ά䚸㐀ᅬ
ᘓ⠏Ꮫ
㐀ᙧ⨾⾡ ᙮้
㐀ᙧ⨾⾡䚸᙮้
⤮⏬䚸⿦㣭⨾⾡
⏬ἲ ⤮
⏬ἲ䚸⤮
ᕤⱁ⨾⾡䚸༳ๅ䚸∧⏬
෗┿⾡ ෗┿
෗┿⾡䚸෗┿
㡢ᴦ
ፗᴦ ₇ⱁ
ፗᴦ䚸₇ⱁ
䠐䠌䜋䛹䛾୺㢟䜢タᐃ
䛹 ୺ 䜢 ᐃ
䡖
䠍
䠎
䠏
䠐
䠝
䠝䠶
䠞
⥲グ
▱㆑
ᅗ᭩㤋Ꮫ
ᅗ᭩Ꮫ
䝆䝱䞊䝘䝸䝈䝮
⮬↛⛉Ꮫ
ᩘ⌮⛉Ꮫ
ᩘᏛ
䠞䠶
䠟
䠠
䠡
䠢
䠣
䠤
…
≀⌮ⓗ⛉Ꮫ
≀⌮Ꮫ
ᕤᏛ
໬Ꮫ
ᢏ⾡
⏕≀Ꮫ
ᆅᏛ
...
±
±
䝁䝻䞁ศ㢮ἲ䠄䝣䜯䝉䝑䝖䠅
‡ ་Ꮫ
± ჾᐁ 䠖 ║䚸⫶䚸⾑ᾮ䚸㦵䚸…
± ศ⛉ 䠖 ゎ๗Ꮫ䚸⏕⌮Ꮫ䚸⑌⑓䚸⾨⏕䚸…
‡ ⤮⏬
± ᵝᘧ
± ⣲ᮦ
± ᮦᩱ
± ᢏἲ
䠖
䠖
䠖
䠖
䛣䛸䜀䛾ศ㢮
᪥ᮏ⏬䚸すὒ⏬䚸᐀ᩍ⏬䚸…
ே≀ 㢼ᬒ 㟼≀
ே≀䚸㢼ᬒ䚸㟼≀䚸…
⣬䚸ᮌ䚸䜺䝷䝇䚸…
ᵓᅗ Ⰽᙬ Ỉᙬ Ἔ⤮
ᵓᅗ䚸Ⰽᙬ䚸Ỉᙬ䚸Ἔ⤮䚸…
±
±
䝅䝋䞊䝷䝇
ᑓ㛛⏝ㄒ䛾䝅䝋䞊䝷䝇
‡ ㄒ䛾ୖ఩ୗ఩䚸ྠ⩏㛵ಀ䛺䛹䜢య⣔ⓗ䛻ᩚ⌮䛧䛯䜒䛾
ㄒ ୖ఩ ఩ ྠ⩏㛵ಀ䛺䛹䜢య⣔ⓗ ᩚ⌮䛧䛯䜒
‡ ศ
ศ㔝䛾Ꮫၥయ⣔䜢᫂䜙䛛䛻䛩䜛
Ꮫ య⣔䜢
䛩䜛
䠄ᑓ㛛⏝ㄒ㞟䠇ɲ䠅
‡ ᩥ⊩᳨⣴䛷䛾⤫ไゝㄒ
± Roget’sThesaurus(1852)
‡ ୍⯡⏝ㄒ䛻䛴䛔䛶䛿ྠ⩏㛵ಀ䛜୰ᚰ䚸༢ㄒ䛾㑅ᢥ䛾ᡭ
䛜
ຓ䛡
± ➼౯㛵ಀ䠄ඃඛㄒ䚸㠀ඃඛㄒ䠅
➼౯㛵ಀ䠄ඃඛㄒ 㠀ඃඛㄒ䠅
± 㝵ᒙ㛵ಀ䠄ୖ఩ㄒ䚸ୗ఩ㄒ䠅
± 㐃᝿㛵ಀ
e.g. ゅᕝ㢮ㄒ᪂㎡඾
ศ㢮ㄒᙡ⾲䠄ᅜ❧ᅜㄒ◊䠅
NTT᪥ᮏㄒㄒᙡ኱⣔
WordNet
LongmanLanguageActivator
e.g.JST䝅䝋䞊䝷䝇䠄4୓ㄒ䠅
±
±
᝟ሗ᳨⣴䠄ᩥ᭩᳨⣴䠅
䝔䜻䝇䝖䛾≉ᚩ䝧䜽䝖䝹⾲⌧ї㢮ఝᗘィ⟬
± ᅗ᭩᳨⣴
± ᪂⪺グ஦᳨⣴
᝟ሗ᳨⣴
± 㟁Ꮚ䝯䞊䝹᳨⣴
± Web䝨䞊䝆᳨⣴
W b䝨 䝆᳨⣴
± ♫ෆᩥ᭩᳨⣴
±
±
䜲䞁䝍䞊䝛䝑䝖
䜴䜵䝤䠄World Wide Web WWW䠅
䜴䜵䝤䠄WorldWideWeb,WWW䠅
‡ ᗈ⩏䠖」ᩘ䛾䝁䞁䝢䝳䞊䝍䝛䝑䝖䝽䞊䜽䛾┦஫᥋⥆
ᗈ⩏ 」ᩘ
䝢
䝍䝛
䜽 ┦ ᥋⥆
‡ ⊃⩏䠖ᅜ㝿ⓗ䛻ᗈ䛟┦஫᥋⥆䛥䜜䛯䜒䛾䠄TheInternet䠅
‡ Ṕྐ䠖
‡ 䜲䞁䝍
䜲䞁䝍䞊䝛䝑䝖ୖ䛷ᥦ౪䛥䜜䜛䝝䜲䝟䞊䝔䜻䝇䝖䝅䝇
䝛 䝖ୖ䛷ᥦ౪䛥䜜䜛䝝䜲䝟 䝔䜻䝇䝖䝅䝇
䝔䝮
‡ ᩥ᭩䛿HTML䠄䝝䜲䝟
ᩥ᭩䛿HTML䠄䝝䜲䝟䞊䝔䜻䝇䝖グ㏙ゝㄒ䠅䛷グ㏙
䝔䜻䝇䝖グ㏙ゝㄒ䠅䛷グ㏙䠈
ูᩥ᭩䜈䛾ཧ↷䠄䝸䞁䜽䠅䜢ᇙ䜑㎸䜐䛣䛸䛷䜲䞁䝍䞊
䝛䝑䝖ୖ䛾ᩥ᭩䛾┦஫ཧ↷䜢ྍ⬟䛸䛩䜛
‡ 䜴䜵䝤䝕䜱䝺䜽䝖䝸䠖1994ᖺ Yahoo!
‡ ᳨⣴䜶䞁䝆䞁
1969ᖺ 䜰䝯䝸䜹䛾ᅜ㜵⥲┬䛻䜘䜛ARPANET
1984ᖺ ᪥ᮏ䛾Ꮫ⾡⤌⧊䛾◊✲⏝䝛䝑䝖䝽䞊䜽䠦䠱䠪䠡䠰
1991ᖺ Ḣᕞ⣲⢏Ꮚ≀⌮Ꮫ◊✲ᡤ䛾䝔䜱䝮
Ḣᕞ⣲⢏Ꮚ≀⌮Ꮫ◊✲ᡤ䛾䝔䜱䝮䞉䝞䞊䝘䞊䝈=䝸䞊
䝞 䝘 䝈=䝸
䛜WorldWideWeb䝥䝻䝆䜵䜽䝖䜢Ⓨ⾲
‡ ≉ᐃ䛾㞟୰䛧䛯㈐௵୺య䛿䛺䛟
≉ᐃ䛾㞟୰䛧䛯㈐௵୺య䛿䛺䛟䠈᥋⥆䛧䛶䛔䜛⤌⧊
᥋⥆䛧䛶䛔䜛⤌⧊
䛜ྛ䝛䝑䝖䝽䞊䜽䜢⟶⌮
±
1994ᖺ WebCrawler,Infoseek,Lycos
1995ᖺ AltaVista,Excite䠄᪥ᮏ䠖Yahho,ODiN,༓㔛║䠅
1998ᖺ Google
G
l
±
ฟ඾䠖KWWSMDZLNLSHGLDRUJZLNL:ZZ
᳨⣴䜶䞁䝆䞁䠙䜽䝻䞊䝷䞊䠇඲ᩥ᳨⣴
‡ 䝝䜲䝟䞊䝸䞁䜽䜢䛯䛹䛳䛶HTMLᩥ᭩䜢཰㞟
䛧䠈ᕧ኱䛺⣴ᘬ䜢సᡂ䛧䠈඲ᩥ᳨⣴䜢䛚䛣
䛺䛖
:RUOG :LGH :HE
:RUOG:LGH:HE
䜽䝻䞊䝷䞊 䠤䠰䠩䠨
䝔䜻䝇䝖
⣴ᘬసᡂ
඲ᩥ᳨⣴
ᩥ᳨⣴ ⣴ᘬ
±
฼⏝⪅
㌿⨨䜲䞁䝕䝑䜽䝇䠄⣴ᘬ䠅
ᩥ᭩䠍
ゝㄒ ゝㄒ䚸䝁䞁䝢䝳䞊䝍䚸ၥ㢟䚸
ゝㄒ䚸
䝁䞁䝢䝳䞊䝍 ၥ㢟 ၥ㢟
ᩥ᭩䠎
䝁䞁䝢䝳䞊䝍䚸ၥ㢟䚸ၥ㢟䚸᝟ሗ
ᩥ᭩䠏
ゝㄒ䚸ၥ㢟䚸ၥ㢟䚸ၥ㢟䚸᝟ሗ䚸᝟ሗ
ᩥ᭩䠐
ၥ㢟 ᝟ሗ
ၥ㢟䚸᝟ሗ
䝃䞊䝏䜶䞁䝆䞁
±
ㄒ䛾㔜せᗘ䠄TF.IDF䠅
ㄒ䛾㢖ᗘ䠄7
ㄒ䛾㢖ᗘ䠄7HUP)UHTXHQF\䠅
)
䠅
ᩥ᭩䠍
ᩥ᭩䠎
ᩥ᭩䠏
ᩥ᭩䠐
,')
ゝㄒ
䝁䞁䝢䝳䞊䝍
7)
ゝㄒ
ᩥ᭩䠍䚸ᩥ᭩䠏
ၥ㢟
䝁䞁䝢䝳 䝍
䝁䞁䝢䝳䞊䝍
ᩥ᭩䠍 ᩥ᭩䠎
ᩥ᭩䠍䚸ᩥ᭩䠎
᝟ሗ
ၥ㢟
ᩥ᭩䠍䚸ᩥ᭩䠎䚸ᩥ᭩䠏䚸ᩥ᭩䠐
᝟ሗ
ᩥ᭩䠎䚸ᩥ᭩䠏䚸ᩥ᭩䠐
඲ᩥ᭩ᩘ ㄒ䛾ฟ⌧䛩䜛ᩥ᭩ᩘ
ㄒ䛾ฟ⌧䛩䜛ᩥ᭩ᩘ
䠄,QYHUVH'RFXPHQW)UHTXHQF\䠅
±
≉ᚩ䝧䜽䝖䝹
ㄒ䛾㔜せᗘ䠄TF.IDF䠅
7) ,')
7),')
ゝㄒ
±
ᩥ᭩䠍
ᩥ᭩䠎
ᩥ᭩䠏
ᩥ᭩䠐
䝁䞁䝢䝳䞊䝍
ၥ㢟
᝟ሗ
ᒓᛶ
ಶయ
±
㻭
㻮
㻯
㻰
㻱
㼒㻝
㻜
㻝
㻜
㻝
㻜
㼒㻞
㻝
㻜
㻝
㻜
㻝
㼒㻟
㻜
㻝
㻜
㻝
㻜
㼒㻠
㻜
㻝
㻝
㻜
㻝
㼒㻡
㻝
㻝
㻜
㻜
㻝
㼒㻢
㻝
㻜
㻜
㻝
㻝
±
PageRank
ㄒ䛾㔜せᗘ䠄
ㄒ䛾㔜せᗘ䠄TF.IDF䠅
䠅
‡ 䛂ከ䛟䛾Ⰻ㉁䛺
䛂ከ䛟䛾Ⰻ㉁䛺Web䝨䞊䝆䛛䜙ཧ↷䛥䜜䛶䛔䜛
䝨 䝆䛛䜙ཧ↷䛥䜜
䜛
Web䝨䞊䝆䛿Ⰻ㉁䛷䛒䜛䛃
᳨⣴
ゝㄒ ၥ㢟
7),')
ᩥ᭩䠍
ᩥ᭩䠎
ᩥ᭩䠏
ᩥ᭩䠐
ゝㄒ
䝁䞁䝢䝳䞊䝍
䝁䞁䝢䝳
䝍
ၥ㢟
᝟ሗ
䠍䠌䠌
䠇䠑䠌
5v
¦
v ou % v
5u 5
䠑䠐
䠇䠑䠌
䠇䠐
䠍䠎
c$5
䠑䠌
䠇䠐
䠇䠐
±
±
䜰䞁䜹 䝔䜻䝇䝖䛾฼⏝
䜰䞁䜹䞊䝔䜻䝇䝖䛾฼⏝
‡ 䜰䞁䜹䞊䝔䜻䝇䝖 : 䝸䞁䜽䛜ᙇ䜙䜜䛯ᩥᏐิ
౛䠖<a href=“http://www.kyotoͲu.ac.jp/”>ி㒔኱Ꮫ</a>
䜰䞁
䝔䜻
䝸䞁䜽ඛ䝔䜻
㒊 䜏䛺䛩
‡ 䜰䞁䜹䞊䝔䜻䝇䝖䛿䝸䞁䜽ඛ䝔䜻䝇䝖䛾୍㒊䛸䜏䛺䛩
ி㒔኱Ꮫ
± ≉ᐃ䛾䝖䝢䝑䜽䛻㛵㐃䛧䚸
≉ᐃ䛾䝖䝢䝑䜽䛻㛵㐃䛧
⿕ཧ↷ᩘ䛾኱䛝䛔Web
䝨 䝆䛜᳨⣴䛥䜜䜔䛩䛔
䝨䞊䝆䛜᳨⣴䛥䜜䜔䛩䛔
ி㒔኱Ꮫ
䛂ி㒔኱Ꮫ
䛂ி㒔኱Ꮫ䛃
ி㒔኱Ꮫ
䛂ி㒔኱Ꮫ䛃
䛂ி㒔኱Ꮫ䛃
KWWSZZZN\RWRXDFMS
.\RWR8QLY
± 䝸䞁䜽ඛ䛻ྵ䜎䜜䛺䛔
ㄒྃ䛷䜒᳨⣴䛷䛝䜛
䠄౛䠖䇾ி኱䇿䠅
䠄౛䠖
ி኱ 䠅
䛂.\RWR8QLY䛃
ி኱
ㄒ㽢ᩥ᭩䛾⾜ิ
7)
ᩥ᭩䠍
ᩥ᭩䠎
ᩥ᭩䠏
ᩥ᭩䠐
ゝㄒ
䝁䞁䝢䝳䞊䝍
ၥ㢟
᝟ሗ
䛂ி኱䛃
ி኱
䛂ி኱䛃
±
±
ㄒྃ䛾㢮ఝᗘ
ㄒ㽢ᩥ᭩䛾⾜ิ
ព࿡䛜ఝ䛯ㄒ䛿ఝ䛯䝁䞁䝔䜻䝇䝖䛷ฟ⌧ >)LUWK@
>)L WK@
7) ,')
7),')
ᩥ᭩䠍
ᩥ᭩䠎
ᩥ᭩䠏
ᩥ᭩䠐
ゝㄒ
䝁䞁䝢䝳䞊䝍
ၥ㢟
᝟ሗ
䛾 デᐹ
䛻 ┦ㄯ
་⪅ 䛾 チྍ
䛜 ቑ䛘䜛
䛾 ୙㣴⏕
͏͏
䛾 デᐹ
䛻 ┦ㄯ
Ҹ ་ᖌ 䛾 チྍ
䠄ྡモ㛫䠅
䛜 ቑ䛘䜛
䛜 ㌿ᶵ
͏͏
Ⓨ⑓
፹௓䛧䛶
ே䛻䛖䛴䜛
͏͏
͏͏
Ҹ
PET
䛜 ᭷ຠ
䛾 ཷデ
͏͏
䛜 ᭷ຠ
Ҹ PET᳨ᰝ 䛾 ཷデ
䠄」ྜྡモ䠅
͏͏
Ⓨ⑓
፹௓䛧䛶
ே䛻ឤᰁ䛩䜛
͏͏
͏͏
䠄㏙ㄒ㡯㛫䠅
㞳䛥䛺䛔
ឤືⓗ䛷
㨩஢䛩䜛
͏͏
͏͏
±
ไᗘ 䜢
ไᗘ 䜢
᮲౛ 䜢 ᗫṆ䛩䜛 Ҹ ᮲౛ 䜢 ୰Ṇ䛩䜛
͏͏
䠄㏙ㄒ㛫䠅 ͏͏
Ҹ
䠄័⏝ྃ䠅
㞳䛥䛺䛔
ឤືⓗ䛷
ᚰ䜢䛸䜙䛘䜛
͏͏
͏͏
±
᝟ሗ᥎⸀
䝣䜷 䜽䝋䝜䝭 (folksonomy)
䝣䜷䞊䜽䝋䝜䝭䞊
(f lk
)
㽢 㽢 㽢㽢
䝴䞊䝄 $
ၟရ䠍
ၟရ䠎
ၟရ䠏
ၟရ
ၟရ䠐
"
䝴䞊䝄$
䛸䛾㢮ఝᗘ
䠉
䝴䞊䝄 %
䝴䞊䝄 &
䝴䞊䝄
䝄'
䝴䞊䝄
䝴
䝄(
䠉
‡ folks䠄Ẹ⾗䠅䠇taxonomy䠄ศ㢮ἲ䠅
䝄䛻䜘䜛䜴䜵䝤ୖ䛾᝟ሗ 䛾䝍䜾௜䛡
‡ 䝴䞊䝄䛻䜘䜛䜴䜵䝤ୖ䛾᝟ሗ䜈䛾䝍䜾௜䛡
䠄ศ㢮䠅
ඹྠసᴗ䛻䜘䜛ศ㢮 䝍䜾䛾᳨⣴䜔䝍䜾䜢௜
‡ ඹྠసᴗ䛻䜘䜛ศ㢮䠊䝍䜾䛾᳨⣴䜔䝍䜾䜢௜
䛡䛯ே䠈䛭䛾ே䛜䛴䛡䛯௚䛾䝍䜾䜢ㄪ䜉䜛䛣
䛸䛜䛷䛝䜛䠊
౛䠅 䛿䛶䛺䝤䝑䜽䝬䞊䜽䠄䝋䞊䝅䝱䝹䝤䝑䜽䝬䞊
䜽䠅 Flickr䠄෗┿ඹ᭷䝃䜲䝖䠅 䝙䝁䝙䝁ື⏬
䜽䠅䠈Flickr䠄෗┿ඹ᭷䝃䜲䝖䠅䠈䝙䝁䝙䝁ື⏬
䠄ື⏬ඹ᭷䝃䜲䝖䠅
±
±
10/15 22䠖₇⩦
10/15,22䠖₇⩦
䜎 䛸 䜑
z10/15
‡ LATCH:䠑䛴䛾ᩚ⌮Ჴ
‡
‡
± Location,Alphabet,Time,Category,Hierarchy
Location Alphabet Time Category Hierarchy
‡ ேⅭศ㢮
㢮 vs. 㢮
㢮ᆺศ㢮䠄㢮ఝᛶ䠅
㢮 㢮
‡
± ື᳜≀ศ㢮
± ᅗ᭩䛾ศ㢮ἲ
ሙᡤ䠖Ꮫ⾡᝟ሗ䝯䝕䜱䜰䝉䞁䝍䞊༡㤋203
₇⩦ㄢ㢟䠖ᅗ᭩䜢䠪䠠䠟䛻ᇶ䛵䛔䛶ศ㢮䛩䜛
KULINE䛾ศ㢮᳨⣴ᶵ⬟䜢౑䛖
䛿䛶䛺䝤䝑䜽䝬䞊䜽䜢౑⏝䛩䜛
‽ഛ䠖䝯䝕䜱䜰䝉䞁䝍䞊䛾䜰䜹䜴䞁䝖䛾☜ㄆ䛸䛿䛶䛺䜰䜹䜴䞁䝖䛾ྲྀᚓ
z10/22
± 䛣䛸䜀䛾ศ㢮
‡
‡
± ᝟ሗ᳨⣴䚸᝟ሗ᥎⸀
±
ሙᡤ䠖㝃ᒓᅗ᭩㤋䠏㝵䝷䜲䝤䝷䝸䞊䝩䞊䝹
ሙᡤ䠖㝃ᒓᅗ᭩㤋䠏㝵䝷䜲䝤䝷䝸
䝩 䝹
₇⩦ㄢ㢟䠖ᅗ᭩䜢NDLC䛻ᇶ䛵䛔䛶ศ㢮䛩䜛
㝃ᒓᅗ᭩㤋 ᭩ᯫ
㝃ᒓᅗ᭩㤋䛾᭩ᯫ䛷䝤䝷䜴䝆䞁䜾
䝷䜴䝆䞁䜾
ୖグ䜢䜅䜎䛘䛯䜾䝹䞊䝥䝽䞊䜽
2014/10/15
学術情報リテラシー入門 第3回 分類演習1
本日の内容
• 課題A
分類を使った検索について
(日本十進分類法)
学術情報リテラシー入門(第3回)
分類演習1
• 課題B
フォークソノミーの活用について
(はてなブックマーク)
2014年10月15日
情報学研究科 黒橋禎夫教授
分類担当チーム演習補助者
図書館における分類
分類演習1
・デューイ十進分類法(DDC)
・国際十進分類法(UDC)
・コロン分類法
課題A
・米国議会図書館分類(LCC)
・日本十進分類法(NDC)
・国立国会図書館分類法(NDLC)
など
日本十進分類法(NDC)
日本十進分類法(NDC)
*NDC・・・Nippon Decimal Classification
0 総記
1 哲学
2 歴史
3 社会科学
4 自然科学
5
6
7
8
9
技術
産業
芸術
言語
文学
0
1
2
3
4
5
6
7
8
9
総記
哲学・宗教
歴史
社会科学
自然科学
技術
産業
芸術
言語
文学
40 自然科学
41 数学
42 物理学
43 化学
44 天文学、宇宙科学
45 地球科学、地学
46 生物科学、一般生
物学
47 植物学
48 動物学
49 医学、薬学
410 数学
411 代数学
412 数論[整数学]
413 解析学
: :
より細かく、3桁以
上で分類すること
もある。
1
2014/10/15
学術情報リテラシー入門 第3回 分類演習1
資料探索における分類の活用
資料探索における分類の活用
資料探索の手がかり
・書名、著者名
・主題 (~について書かれた資料はないか)
レポート作成、卒業論文の執筆
⇒網羅的に資料を収集する必要
0
1
2
3
4
5
6
7
8
9
総記
哲学・宗教
歴史
社会科学
自然科学
技術
産業
芸術
言語
文学
様々な方法を活用することが大切
分類は主題をもとに資料を探す際に有効
・複数にわたる主題をもつ資料や新しい分野に
ついての資料の探索には工夫が必要(複数の
分類で調べる・どの分類になるかを考える)
分類演習1 課題Aの概要
分類による資料探索のアプローチ
・ブラウジング (書架を眺める)
・KULINEの分類検索を使う
410 数学
40 自然科学
411 代数学
41 数学
412 数論[整数学]
42 物理学
413 解析学
43 化学
:
:
44 天文学、宇宙科学
45 地球科学、地学
・同じ主題のものが集中する
46 生物科学、一般生
物学
・体系的で階層性があり、関連する資料も探し
やすい47 植物学
48 動物学
・書名などにキーワードが含まれていないものも
探せる49 医学、薬学
分類を活用した資料探索について学ぶ
・検索した図書のNDC分類を確認する
・KULINEの分類検索を使う
課題A
課題A
◇A‐1.
下記4つのテーマから2つを選択し、以下の課題
に答えてください。
○テーマ
・京都の祭りの文化
・地球温暖化のメカニズムと対策
・ヒトの進化
・スポーツと政治
選択したテーマに関連するキーワードをそれぞれにつき2つ挙げて
ください。キーワードのどちらか、または両方を使ってKULINEの詳
細検索画面から検索し、それらをタイトルに含む図書を1冊ずつ選
び、その図書の書名とNDC(日本十進分類法)の分類番号3桁を答
えてください。
NDC分類番号は9版
の分類番号を答えて
ください。9版の記述
がなければ8版の分
類番号を答えてくださ
い。A‐2以下も同様で
す。
2
2014/10/15
学術情報リテラシー入門 第3回 分類演習1
タイトル検索とNDC分類の確認
タイトル検索とNDC分類の確認
詳細検索をクリック
タイトル欄にキーワードを入力して
クリック
タイトル検索とNDC分類の確認
タイトル検索とNDC分類の確認
書名をクリック
書誌詳細画面
NDC9版(なければ8版)の分
類番号を確認。今回は3桁
でみる。
NDC9:121.6 →
NDC9版の121「哲学>東洋思想>日本思想」
課題A
NDCの分類表の参照
◇A‐2. NDC分類表をもとに、選択したテーマについて資料探索する際
に有効と思われるNDC分類番号3桁をそれぞれ考えられる限り
複数挙げてください。
クリック
3
2014/10/15
学術情報リテラシー入門 第3回 分類演習1
第1階層
第2階層
日本十進分類法
(NDC)9版を選択
第1階層
どれか1つを選択
第3階層
クリックして展開させていくと、
選択したグループの下位のグ
ループが表示される
分類検索
課題A
HOME画面から
◇A‐3. A‐2.で挙げたNDC分類番号3桁を用いてKULINEで分類検索を行い、
書名にA‐1.で挙げたキーワードを含まないが、各テーマについて調
べるのに役立ちそうな図書を1冊ずつ答えてください。必要に応じて、
分類検索に加えて、件名による絞込み検索を使って図書を絞り込
んでください。
クリック
検索結果一覧
第1階層
第2階層
第3階層
クリックして展開させていくと、
選択したグループの下位のグ
ループが表示される
分類番号が表示される。
NDC9(日本十進分類法9版)
121(哲学>東洋思想>日本思想)
A‐1.で挙げたキーワードを
含まないものを1冊答える
選択した
分類で検索
4
2014/10/15
学術情報リテラシー入門 第3回 分類演習1
件名による絞り込み検索
件名による絞り込み検索
件名で絞り込み検索
(例:日本思想)
絞り込み条件、結果一覧が
表示される。
分類検索
詳細検索画面から
課題A
◇A‐4. KULINEの分類検索を使うことの利点や欠点を述べてください。
選択画面から分類を選択し、
クリックして分類番号確定
京都大学では図書館・室ごとに様々な分類法が
使われている
例)
・日本十進分類法(NDC)
・国立国会図書館分類法(NDLC)
・その他、独自の分類
各図書館内に分類表が掲示されていたり、図書館のHPに
その館の分類方法について紹介されている場合もあります。
提出方法
授業ページから答案ファイルをダウンロードして回答を記入し、
メールに添付して提出する。課題Aと課題Bの回答を一緒のファイ
ルで提出する。
• 件名:「学術情報リテラシー入門分類演習1 氏名 学生番号」
• 答案ファイルをメールに添付すること。
• 作成中の答案は消えてしまわないようにこまめに保存するように
すること。
• PCのデスクトップに保存したファイルはログアウトすると消えてしま
うので、USBメモリなどに保存すること。
5
2014/10/15
学術情報リテラシー入門 第3回 分類演習1
課題時間
質問・相談があれば
補助者までどうぞ!
15時30分まで
分類とは?

情報を一定の法則によって整理するもの
分類する視点・観点によって方法は異なる

図書の分類

分類演習1 課題B
規則に基づき、体系的に配列
→図書分類法
日本十進分類法 (NDC)、国立国会図書館分類法(NDLC)など
ウェブの情報は?
カテゴリ検索
フォークソノミー(folksonomy)
サービス提供側により作成された
カテゴリ(テーマやジャンル)ごとに分類されたリンク集
の中からウェブサイトを検索
上位階層にあるカテゴリ名を
クリック

folks(人々) + taxonomy(分類)
利用者自らがウェブ上の情報に自由にタグ(目印
となるキーワード)を付与し、利用者間で共有
⇒共同作業による分類

例) Yahoo!カテゴリ
下位階層に
あるカテゴリ
が表示
階層構造
6
2014/10/15
学術情報リテラシー入門 第3回 分類演習1
フォークソノミーの例
はてなブックマークとは
Flickr(写真)
YouTube(動画)
Citeulike、 Mendeley、 Connotea(文献)
Delicious、はてなブックマーク (webサイト)




ソーシャルブックマークサービスの1つ

ウェブページをブックマークし、タグやコメントをつけて
整理する
→自分の収集した情報の整理
 ブックマークを公開し共有する
→・他の利用者が収集した情報や、ウェブページ に付与したタグ・
ソーシャルブックマーク
コメントを参照
・タグにより検索
⇒ウェブ上の情報検索・整理に活用
はてなアカウント取得
はてなブックマークを使う






事前準備

はてなアカウント取得

ブックマークレットの設定
※注意※ はてなIDには学生番号やECS-ID
を使用しないでください。
ブックマークする
自分の追加したブックマークをみる
自分の追加したブックマークから同じタグをつけ
たページを検索
他のユーザのタグ・コメントをみる
タグをもとに全体のブックマークから検索
② ブックマークレットを設定する
ブックマークレットの設定
① ログインする
手順は、前回の授業で配布したプリント、または
学術情報リテラシー入門ページの「はてなブック
マークの登録方法」を参照。
「ログイン」をクリック
マイページ
http://b.hatena.ne.jp/ に接続
トップページ
・「はてなブックマークをはじめる」をクリック
または、
・「ヘルプ」をクリック⇒「はてなブックマーク
をはじめる」から入る
ID、パスワードを
入力して「送信」
→マイページへ
7
2014/10/15
学術情報リテラシー入門 第3回 分類演習1
ブックマークレットの設定画面
ブックマークする
の両方を追加してください。
右クリック→お気に入りに追加
⇒課題B-1,B-3
ブックマークしたいページを見つけて
お気に入りバーの
をクリック
セキュリティ警告:追加しようとしているお気に
入りは、安全でない可能性があります。続行し
ますか?
→「はい」をクリック
作成先:「お気に入りバー」に追加
※お気に入りバーが表示されない場合は、ページ上部のメニュー付近を右クリックして「お
気に入りバー」を 追加
※上記でうまくいかない場合は、
ページ下にあるリンクを設定して
ください。
タグ、コメントの入力画面
自分の追加したブックマークをみる
例) [図書館][京都大学]情報検索への入口
→ タグ: [図書館][京都大学]
コメント:情報検索への入口
「マイページ」をクリックしてログイン
・タグとコメントを入力
する。(タグは[ ]で囲む。
[ ]を付けない場合は
コメントとして表示され
る。)
・「ブックマークを確認」
をチェックして「追加」を
クリック
ログアウトするときはここ(▼)をクリック
⇒プルダウンメニューから「ログアウト」を選択
マイページ
自分の追加したブックマークから同じタグを
つけたページを検索
マイページ
アカウントID
自分のつけた
ブックマーク
タグをクリック
タグ
コメント
タグ・コメントを編集する
ブックマークを削除する
8
2014/10/15
学術情報リテラシー入門 第3回 分類演習1
自分のブックマークを対象にしたタグ検索結果
(タグ「図書館」で検索)
他のユーザのタグ・コメントをみる
⇒課題B-2
○○usersという部分を
クリック
自分がブックマークしたページ
のうち、選択したタグをつけた
もののみ検索される
タグをもとに全体のブックマークから検索
⇒課題B-3
タグ
タグをクリック
コメント
全体のブックマークを対象にしたタグ検索結果
KULINEのタグ機能について
(タグ「図書館」で検索)


2012年度より1年間試行運用ののち、本サービスに移行。
当面は図書館・室によるタグ付け。利用者は検索のみ使用可。
全体のブックマークから
選択したタグがつけられ
たページが検索される
9
2014/10/15
学術情報リテラシー入門 第3回 分類演習1
ホーム画面(簡易検索画面)
課題Bの目的
タグ検索


ホーム画面で、簡
易検索下の「タグ
検索」をクリック。
図書分類法やカテゴリ検索と比較しながら
フォークソノミーのメリット、デメリットを考察し、
情報検索における分類について考えを深める
キーワードでタグ
を検索。表示され
ているリストから
も選択できる。
研究成果
課題B B-1
京都大学ホームページ
京都大学ホームページに掲載されている研究成果のうち
2014年8月付の記事から自分の興味のあるものを3つ選
び、それぞれのページにタグとコメントを付けて、はてなブ
ックマークに登録してください。その際、タグは必ず複数
付けてください。
ホーム
> 研究・産官学連携
> 研究成果
ホーム>研究・産官学連携>研究成果
http://www.kyoto-u.ac.jp/ja/research/research_results/
B-2
8月の日付のニュース
B-1でブックマークしたページに他のユーザが付けた
タグを確認し、自分の付けたタグと違うものがあれば
どのような点に違いがあるか具体例を挙げて、相違
点を述べてください(例:日本語と英語の違い、植物と
コムギなどの階層の違い、など)。
選択しているのが自分だけだった場合は、自分の考
えたタグの工夫した点を答えてください。
10
2014/10/15
学術情報リテラシー入門 第3回 分類演習1
B-3
B-1でブックマークした記事の中から1つ選択してく
ださい。
自分が記事に付けたタグと同じタグが付けられて
いるページを全体のブックマークから検索し、記事
の内容に関連したページを3つブックマークしてくだ
さい。
同じタグが付けられているページがない場合は、
選択した記事に他の利用者によって付けられたタ
グで同様に検索し、記事の内容に関連したページ
を3つブックマークしてください。
B-4
フォークソノミーのメリット、デメリットについて、図書
分類法やカテゴリ検索のような、あらかじめ作成され
た既存の分類体系に基づく情報検索と比較しながら
考察してください。
提出方法
解答用紙(Wordファイル)をダウンロードして、課題A、B
の答案を記入し、メールにファイル添付して提出する
次回(10/22)の授業に関する連絡

・提出先:[email protected]
・件名:「学術情報リテラシー入門分類演習1 氏名 学生番号」
・締切: 【厳守】2014/10/20(月) 24:00 [日本時間]
※作成中の答案は消えてしまわないようにこまめに保存すること
※PCのデスクトップに保存したファイルはログアウトすると 消えるので
USBメモリなどに保存すること

附属図書館3階 ライブラリーホールで行います。直接
集合してください(これまでと場所が異なるので注意!)
演習1の答案に記入した、選択したテーマをもとに、
図書館での演習・グループワークを行います。
・用意できる人は、資料として、課題Aの答案をプリントア
ウトして持参してください。

※答案には必ずはてなアカウント(ID)を記入すること
(成績が出るまで、はてなブックマークを消さないようにしてください)
11
はじめに
学術情報リテラシー入門 第4回
分類演習2

NDLC(国立国会図書館分類法)について

課題C(グループワーク)

グループ発表

課題提出
2014年10月22日(水)4限
前回までの復習
日本十進分類法(NDC)
000
100
200
300
400
500
600
700
800
900
図書分類法
 NDC(日本十進分類法):
十進法を用いた分類方法。すべての分類を0~9の数字
の組み合わせで表す。3桁の数字と細分類からなる。


代数学・・・4(自然科学)+1(数学)+1(代数学)
→「411」
総記
哲学・宗教
歴史
社会科学
自然科学
技術
産業
芸術
言語
文学
410 数学
400 自然科学
411 代数学
410 数学
412 数論[整数学]
420 物理学
: :
430 化学
440 天文学、宇宙科学
450 地球科学、地学
460 生物科学、一般生
物学
470 植物学
480 動物学
490 医学、薬学
大
NDLC分類表
NDLCとは
国立国会図書館分類法
National Diet Library Classification
 国立国会図書館(NDL)が作成した分類法。


アルファベットと数字の組み合わせで表す。
代数学・・・MA(数学)+61(代数学) →「MA61」

京大では附属図書館がNDLCを採用している。

細
1
平成26年度全学共通科目
「学術情報リテラシー入門」 第4回(2014.10.22)
資料の探索方法


演習(課題C)
KULINE・・・タイトル検索や分類検索を使って目的の
本を絞り込む。
グループワーク【C-1~C-4】
 課題A(前回の授業)で選択したテーマごとに3~4名で
グループワーク
 その後、C-3について、3~5分程度の発表を行う。
 時間内に解答用紙をグループで1枚提出。
ブラウジング・・・棚を見て直接本を探す。
思い浮かばなかった本に出会うことも。
個人提出課題(宿題)【C-5,C-6】
 各個人で解答を作成し、期限(来週月曜の24時)まで
にメールで提出。授業の最後に説明します。
課題C【グループワーク】
附属図書館2階
グループで1枚解答用紙を提出

C-1.選択したテーマについて調べるのに有効と思われるNDLC(国
立国会図書館分類法)分類番号を考えられる限り挙げてください。
※分類番号は解答例を参考に、「アルファベット+数字」で答えてください。
数字の区分に当てはまるものが無ければ、アルファベットだけでも構いません。



C-2.C-1で挙げたNDLC分類番号の中で特に有効そうなものをいく
つか選び、その分類番号の棚をブラウジングし、役立ちそうな図書を3
冊挙げてください。
C-3.附属図書館の配架方法でもあるNDLCと、NDC(日本十進分類
法)を見比べて、テーマにおけるそれぞれの分類体系の特徴等を比較
して簡単にまとめてください。
C-4. 他の班の発表を聞いて、気付いたことや感じたことを簡潔にまと
めてください。
発表(15:45-16:05)
15:10-15:45 C-1~C-3の解答記入と発表準備
15:45-16:05 発表 (数グループ)
 16:05-16:15 C-4記入、解答用紙提出
C-3について発表
時間は3分~5分程度
 発表者は何人でも構いません。
 形式は自由ですが、スライドや用紙は使わず、口頭で
発表してください。





2
15:10~15:45の課題解答時間のうちに、発表準備も
行うように。
平成26年度全学共通科目
「学術情報リテラシー入門」 第4回(2014.10.22)
グループ分け

選択したテーマ別に3~
4人でグループを作り、
問題用紙・解答用紙・分
類表のセットをグループ
で1セット受け取ってくだ
さい。
発表(15:45-16:05)
スライド(前)
 C-3.
ヒトの進化
附属図書館の配架方法でもあるNDLCと、
NDC(日本十進分類法)を見比べて、テーマにおける
それぞれの分類体系の特徴等を比較して簡単にまとめ
てください。
京都の祭りの
文化

ポイント
・テーマの分類番号の前後やその周辺にはどのようなものが
テーマは前回の授業で
選んだもの。
 わからない人は補助者
に申し出てください。

分類されているか
地球温暖化の
メカニズムと対
策
・分類全体を見て、選択したテーマ(分野)はどう位置づけられ
スポーツと政治
ているか
・テーマ(分野)の探しやすさ
課題C-5,C-6【個人提出課題】
C-4記入・アンケート
授業後メール提出(解答用紙(WORD)に記入して添付送信)


解答用紙は、C-4を記入の上、必ず提出するように。

アンケートも前の机で回収します。

問題用紙と分類表は回収しません。

C-5.資料探索における図書分類法の活用の意義と留意点につい
て、ブラウジングの効果に触れて、意見を述べてください。
C-6.課題Aのテーマの中から1つを選び、そのテーマに関連する
事項について、自分なりの分類を提案してください。NDCや
NDLCを参考にして、できるだけユニークな分類体系を考えてみま
しょう。
※グループのテーマとは違うテーマでも構いません。
※分類体系の表し方は自由です。Word機能の表や図形を使っても
構いません。
茶-----発酵茶-----紅茶
|
|----半発酵茶----ウーロン茶
|
-----不発酵茶----緑茶----煎茶
|-----玉露
-----番茶
例)テーマ「茶の文化」
提出方法


C-5,C-6(個人提出課題)はメール提出。
解答用紙を授業ページからダウンロードして記入し、
メールに添付して提出。
提出先:[email protected]
件名:「学術情報リテラシー入門分類演習2 氏名 学
生番号」のようにすること
 締切: 【厳守】2014/10/27(月) 24:00 [日本時間]



ファイルの添付忘れに注意!
3
平成26年度全学共通科目
「学術情報リテラシー入門」 第4回(2014.10.22)
Fly UP