๋ณธ๋ฌธ ๋ฐ”๋กœ๊ฐ€๊ธฐ
โœ’๏ธ GURU/AI

[AI] ์ธ๊ณต์ง€๋Šฅ์˜ ๊ฐœ๋…, ๋จธ์‹ ๋Ÿฌ๋‹์˜ ํ•™์Šต ๋ฐฉ๋ฒ•, ์ง€๋„ํ•™์Šต, ์„ ํ˜• ํšŒ๊ท€์™€ ๋ถ„๋ฅ˜

by A Lim Han 2022. 7. 23.

1. ์ธ๊ณต์ง€๋Šฅ ๊ฐœ๋… + ๋จธ์‹ ๋Ÿฌ๋‹์˜ ํ•™์Šต ๋ฐฉ๋ฒ• + ์ง€๋„ํ•™์Šต + ์„ ํ˜• ํšŒ๊ท€์™€ ๋ถ„๋ฅ˜

 

 

 

# ์ธ๊ณต์ง€๋Šฅ (Artificial Intelligence)

: ์ธ๊ฐ„์˜ ํ•™์Šต๋Šฅ๋ ฅ๊ณผ ์ถ”๋ก ๋Šฅ๋ ฅ ๊ทธ๋ฆฌ๊ณ  ์–ธ์–ด ์ดํ•ด ๋Šฅ๋ ฅ์„ ์ปดํ“จํ„ฐ ํ”„๋กœ๊ทธ๋žจ์œผ๋กœ ์‹คํ˜„ํ•˜๋Š” ํ•™๋ฌธ ๋˜๋Š” ๊ธฐ์ˆ 

๋ฌธ์ œ ํ•ด๊ฒฐ ๋Šฅ๋ ฅ ํ•™์Šต ๋ฒ”์šฉ์„ฑ
์ˆ˜์‹ ๊ณ„์‚ฐ ๋ฐ ์‚ฌ์ง„ ์† ๋Œ€์ƒ ํŒ๋‹จ, ์•ŒํŒŒ๊ณ ์˜ ๋ฐ”๋‘‘ํŒ ๋“ฑ์„ ์ดํ•ดํ•˜๊ณ  ๋‹ค์Œ ์ˆ˜๋ฅผ ๊ฒฐ์ •ํ•˜๋Š” ๊ฒƒ ๋“ฑ ๋ฌธ์ œ๋ฅผ ํ•ด๊ฒฐํ•˜๊ธฐ ์œ„ํ•œ ์ง€๋Šฅ์ ์ธ ํ–‰์œ„๋ฅผ ์˜๋ฏธํ•œ๋‹ค. ์—ฌ๋Ÿฌ ๊ฒฝํ—˜์„ ํ†ตํ•ด ํŒจํ„ด์„ ์–ป์–ด๋‚ด๊ณ  ๋‹ค์Œ ํ–‰๋™์— ์˜ํ–ฅ์„ ์ฃผ๋Š” ๊ฒƒ ๋”ฅ๋Ÿฌ๋‹ ๋ชจ๋ธ์„ ์ˆ˜์ •ํ•˜์—ฌ ๋‹ค์–‘ํ•œ ๋ถ„์•ผ์—์„œ ์‘์šฉ์ด ๊ฐ€๋Šฅํ•œ ์ธ๊ณต์ง€๋Šฅ์˜ ํŠน์ง•

 

 

 

# ๋จธ์‹ ๋Ÿฌ๋‹์˜ ํ•™์Šต ๋ฐฉ๋ฒ•

 

1. ์ง€๋„ ํ•™์Šต (Supervised Learning)

: ์ž…๋ ฅ๊ณผ ๋ฏธ๋ฆฌ ์•Œ๋ ค์ง„ ์ถœ๋ ฅ์„ ์—ฐ๊ด€์‹œํ‚ค๋Š” ๊ด€๊ณ„๋ฅผ ํ•™์Šตํ•˜๊ณ , ์ฃผ์–ด์ง„ ์ž…๋ ฅ๊ณผ ์ถœ๋ ฅ ์Œ ์‚ฌ์ด์˜ ๋Œ€์‘ ๊ด€๊ณ„๋ฅผ ํ•™์Šตํ•œ๋‹ค.

 

- ๊ฐ ๋ฐ์ดํ„ฐ์— ๋ ˆ์ด๋ธ”(label) ๋˜๋Š” ํƒœ๊ทธ(tag) ํ‘œ์‹œ๋ฅผ ๋ถ™์ธ๋‹ค.

- ๋ฐ์ดํ„ฐ์—๋Š” 'P'(pass) ๋˜๋Š” 'F'(fail) ๋ ˆ์ด๋ธ”์„ ํ™œ์šฉํ•œ๋‹ค.

 

- ์žฅ์ ๊ณผ ๋‹จ์ 

์žฅ์  ๋‹จ์ 
- ์ด์ „์˜ ๊ฒฝํ—˜์œผ๋กœ๋ถ€ํ„ฐ ๋ฐ์ดํ„ฐ ์ถœ๋ ฅ ์ƒ์„ฑ
- ๊ฒฝํ—˜์„ ์‚ฌ์šฉํ•˜์—ฌ ์„ฑ๋Šฅ ๊ธฐ์ค€์„ ์ตœ์ ํ™”
- ๋‹ค์–‘ํ•œ ์œ ํ˜•์˜ ๋ฌธ์ œ ํ•ด๊ฒฐ์— ๋„์›€์ด ๋จ
- ์‹œ๊ฐ„์ด ๋งŽ์ด ์†Œ์š”๋จ
- ์ถœ๋ ฅ์— ๋ฐ˜๋“œ์‹œ ๋ ˆ์ด๋ธ”์ด ์กด์žฌํ•˜๋Š” ๋ฐ์ดํ„ฐ๋“ค์„ ์‚ฌ์šฉํ•ด์•ผ ํ•จ

 

 

ex 1) ์ž๋™์ฐจ ๋ฒˆํ˜ธํŒ์ด ์˜ค์—ผ๋œ ๊ฒฝ์šฐ ์ธ์‹ํ•˜์ง€ ๋ชปํ•  ์ˆ˜๋„ ์žˆ์Œ -> ์˜ค์—ผ๋œ ๋ฒˆํ˜ธํŒ ์‚ฌ๋ก€๋“ค์„ ํ•™์Šต์‹œ์ผœ ์ธ์‹์œจ์„ ๋†’์ž„

 

ex 2) '์ด๋“ค์€ ์‚ฌ๊ณผ'๋ผ๋Š” ๋ ˆ์ด๋ธ”๋กœ ํ•™์Šตํ•œ ํ›„ ์ƒˆ๋กœ์šด ์‚ฌ๊ณผ ํ•˜๋‚˜๋ฅผ ์ œ์‹œํ•˜๋ฉด ๊ทธ๊ฒƒ์„ '์‚ฌ๊ณผ'๋ผ๊ณ  ์˜ˆ์ธก

 

- ์ง€๋„ํ•™์Šต์˜ ์ข…๋ฅ˜

a. ๋ถ„๋ฅ˜

: ์œ ์‚ฌํ•œ ํŠน์„ฑ์„ ๊ฐ€์ง„ ๋ฐ์ดํ„ฐ๋ผ๋ฆฌ ๋ฌถ์–ด์„œ ๋‚˜๋ˆ”. 2๊ฐœ๋กœ ๋ถ„๋ฅ˜ํ•˜๋Š” ์ดํ•ญ ๋ถ„๋ฅ˜์™€ ๊ทธ ์ด์ƒ์˜ ๊ฐœ์ˆ˜๋กœ ๋ถ„๋ฅ˜ํ•˜๋Š” ๋‹คํ•ญ ๋ถ„๋ฅ˜๊ฐ€ ์žˆ์Œ.

ex) ํ•ฉ๊ฒฉ, ๋ถˆํ•ฉ๊ฒฉ์ด๋‚˜ ์ŠคํŒธ ๋ฉ”์ผ, ์ •์ƒ ๋ฉ”์ผ ๊ตฌ๋ถ„ ๋“ฑ์€ ์ดํ•ญ ๋ถ„๋ฅ˜๋ฅผ ์‚ฌ์šฉํ•˜๊ณ  0~9๊นŒ์ง€์˜ ์•„๋ผ๋น„์•„ ์ˆซ์ž ์ธ์‹์€ ๋‹คํ•ญ ๋ถ„๋ฅ˜๋ฅผ ์‚ฌ์šฉํ•œ๋‹ค.

 

+ ๋ถ„๋ฅ˜์˜ ๋ฐฉ๋ฒ•์—๋Š” ์˜์‚ฌ๊ฒฐ์ • ํŠธ๋ฆฌ, SVM(Support Vector Machine), K-NN(K-Nearest Neighbor) ๋“ฑ์ด ์žˆ๋‹ค.

 ์˜์‚ฌ๊ฒฐ์ • ํŠธ๋ฆฌ
SVM(Support Vector Machine) K-NN(K-Nearest Neighbor)
- ๊ด€์ธก๊ฐ’๊ณผ ๋ชฉํ‘œ๊ฐ’์„ ์—ฐ๊ฒฐํ•˜๋Š” ์˜ˆ์ธก ๋ชจ๋ธ

- ์ตœ๋Œ€ 2๊ฐ€์ง€์˜ ํŒ๋‹จ์„ ํ•˜๋Š” ์ด์ง„ ํŠธ๋ฆฌ ์‚ฌ์šฉ

- ์ฃผํƒ, ์ž๋™์ฐจ ๊ตฌ์ž… ๋น„์šฉ ์ถ”์ • ๋“ฑ์— ์‚ฌ์šฉ

- ์„ ํƒ์‹ ๋ฐฉ๋ฒ•์œผ๋กœ ์ง„ํ–‰
- ๋ฐ์ดํ„ฐ๋ฅผ 2๊ฐœ์˜ ์˜์—ญ์œผ๋กœ ๋ถ„๋ฅ˜ํ•˜๋Š” ์ด์ง„ ๋ถ„๋ฅ˜๊ธฐ๋กœ, ๊ฐ€์žฅ ํฐ ํญ์„ ๊ฐ€์ง„ ํ•˜๋‚˜์˜ ๊ฒฝ๊ณ„์„ ์„ ์ฐพ๋Š” ์•Œ๊ณ ๋ฆฌ์ฆ˜์„ ์‚ฌ์šฉ

- ์ƒˆ๋กœ์šด ๋ฐ์ดํ„ฐ๊ฐ€ ์–ด๋Š ์˜์—ญ์— ์†ํ•˜๋Š”์ง€๋ฅผ ํŒ๋‹จํ•˜๊ณ , ์˜์—ญ์˜ ์—ฌ๋ฐฑ (margin, gap)์ด ์ตœ๋Œ€๊ฐ€ ๋˜๋Š” ์ค‘์‹ฌ์„  ์ฐพ๊ธฐ

- ํŒจํ„ด์ธ์‹๊ณผ ์ž๋ฃŒ ๋ถ„์„์„ ์œ„ํ•œ ๋ชจ๋ธ๋กœ ๋ฉ€ํ‹ฐ๋ฏธ๋””์–ด ์ •๋ณด ๊ฒ€์ƒ‰ ๋ฐ ๋ถ„๋ฅ˜, ํšŒ๊ธฐ ๋ถ„์„ ๋“ฑ์— ์‚ฌ์šฉ
- '์ตœ๊ทผ์ ‘ ์ด์›ƒ ๋ถ„๋ฅ˜'๋ผ๊ณ ๋„ ๋ถˆ๋ฆฌ๋ฉฐ, ๊ฐ€์žฅ ๊ฐ€๊นŒ์šด ๊ฒƒ๋“ค๊ณผ์˜ ๊ฑฐ๋ฆฌ ๊ณ„์‚ฐ์œผ๋กœ ํด๋ž˜์Šค๋ฅผ ๋ถ„๋ฅ˜ํ•œ๋‹ค.

- ์ƒˆ๋กœ์šด ์ž…๋ ฅ ๋ฐ์ดํ„ฐ์™€ ๊ฐ€์žฅ ๊ฐ€๊นŒ์šด k๊ฐœ์˜ ์ด์›ƒ ๋ฐ์ดํ„ฐ๋ฅผ ์„ ํƒํ•˜๊ณ , ์ด์›ƒ ๋ฐ์ดํ„ฐ๋“ค์˜ ํด๋ž˜์Šค ์ค‘ ๋‹ค์ˆ˜๊ฒฐ๋กœ ๋ฐ์ดํ„ฐ์˜ ํด๋ž˜์Šค๋ฅผ ๊ฒฐ์ •ํ•œ๋‹ค.

- ๋‹ค์ˆ˜๊ฒฐ์— ์˜ํ•ด ๊ฒฐ๊ณผ๊ฐ€ ์‚ฐ์ถœ๋˜๋ฏ€๋กœ ๋ฐ˜๋“œ์‹œ k๋Š” ํ™€์ˆ˜๊ฐ€ ๋˜์–ด์•ผ ํ•œ๋‹ค.

- ๋น ๋ฅด๊ณ  ๊ฐ„๋‹จํ•œ ์•Œ๊ณ ๋ฆฌ์ฆ˜์ด๋ผ๋Š” ์žฅ์ ์ด ์žˆ์–ด ์–ผ๊ตด์ธ์‹๊ณผ ๊ฐ™์€ ์ปดํ“จํ„ฐ ๋น„์ „, ์œ ์ „์ž ๋ฐ์ดํ„ฐ ์ธ์‹ ๋“ฑ์— ํ™œ์šฉ๋œ๋‹ค.

 

 

 

b. ํšŒ๊ท€ (regression)

: ๋ณ€์ˆ˜๋“ค ์‚ฌ์ด์˜ ๊ด€๊ณ„๋ฅผ ๊ฒฐ์ •ํ•˜๋Š” ํ†ต๊ณ„์  ์ธก์ •

 

ex) ์„ ํ˜• ํšŒ๊ท€ : ํ•˜๋‚˜์˜ ๋…๋ฆฝ ๋ณ€์ˆ˜๋ฅผ ์‚ฌ์šฉํ•˜๋Š” ์ง์„ ์œผ๋กœ, ๊ฐ ์ ์—์„œ ํšŒ๊ท€ ์ง์„ ๊นŒ์ง€์˜ y์ถ• ๋ฐฉํ–ฅ์˜ ๊ฑฐ๋ฆฌ์ œ๊ณฑ์˜ ์ดํ•ฉ์ด ์ตœ์†Œ๊ฐ€ ๋˜๊ฒŒ ํ•˜์—ฌ ์–ป์–ด์ง€๋Š” ์ง์„ ์ด๋‹ค.

์ง์„  y = ax + b ๋ฅผ x์— ๋Œ€ํ•œ y์˜ ํšŒ๊ท€ ์ง์„ ์ด๋ผ๊ณ  ํ•œ๋‹ค.

+ ๋ณ€์ˆ˜ ์‚ฌ์ด์˜ ํšŒ๊ท€์— ๋Œ€ํ•ด ๊ฒ€์ •, ์ถ”์ •ํ•˜๋Š” ํšŒ๊ท€ ๋ถ„์„ (regression analysis)๋„ ์กด์žฌํ•œ๋‹ค. ํšŒ๊ท€ ๋ถ„์„์€ ํ•™์Šต ๋ฐ์ดํ„ฐ๋ฅผ ์‚ฌ์šฉํ•˜์—ฌ ์ถœ๋ ฅ๊ฐ’์„ ์˜ˆ์ธกํ•˜๋ฉฐ, ์‚ฐ์ถœ๋ฌผ์€ ํ•ญ์ƒ ํ™•๋ฅ ๋ก ์ ์ธ ์˜๋ฏธ๋ฅผ ๊ฐ€์ง„๋‹ค. ์ฃผ๋กœ ๋‚ ์”จ ์˜ˆ์ธก, ์ฃผํƒ ๊ฐ€๊ฒฉ ์˜ˆ์ธก, ํŒ๋งค์•ก ์˜ˆ์ธก ๋“ฑ์— ํ™œ์šฉ๋œ๋‹ค.

 

 

- ํšŒ๊ท€ vs ๋ถ„๋ฅ˜

๋ถ„๋ฅ˜ ํšŒ๊ท€
์„ ํƒ์‹ ์ถœ๋ ฅ (์—ฌ์ž or ๋‚จ์ž) ์—ฐ์†๊ฐ’์œผ๋กœ ์ถœ๋ ฅ์ด ๋‚˜ํƒ€๋‚จ
์ผ์ • ๊ธฐ์ค€์— ๋”ฐ๋ผ ๋ช…๋ฐฑํ•˜๊ฒŒ ๊ตฌ๋ถ„๋จ ๋ช…ํ™•ํžˆ ์ง์„ ์œผ๋กœ ๊ตฌ๋ณ„๋˜์ง€ ์•Š์Œ

 

 

 

 

 

 

2. ๋น„์ง€๋„ ํ•™์Šต

: ์ถœ๋ ฅ๊ฐ’์„ ์•Œ๋ ค์ฃผ์ง€ ์•Š๊ณ  ์Šค์Šค๋กœ ๋ชจ๋ธ์„ ๊ตฌ์ถ•ํ•˜์—ฌ ํ•™์Šต. ์ž…๋ ฅ๋งŒ ์กด์žฌํ•˜๊ณ  ์ถœ๋ ฅ (๋ ˆ์ด๋ธ”)์ด ์—†์–ด ๊ทœ์น™์„ฑ์„ ์Šค์Šค๋กœ ์ฐพ์•„๋‚ด๋Š” ๊ฒƒ์„ ์ฃผ์š” ๋ชฉํ‘œ๋กœ ํ•จ.

ex) ๋ฐ์ดํ„ฐ ๋งˆ์ด๋‹ (data mining) ๊ธฐ๋ฒ•

 

a. ํด๋Ÿฌ์Šคํ„ฐ๋ง

b. ์ฐจ์› ์ถ•์†Œ

 

 

 

3. ๊ฐ•ํ™” ํ•™์Šต

: ์ฃผ์–ด์ง„ ์ž…๋ ฅ์— ๋Œ€์‘ํ•˜๋Š” ํ–‰๋™์— ๋Œ€ํ•ด ๋ณด์ƒ์„ ์ฃผ๊ณ , ์ด๋Ÿฌํ•œ ๋ณด์ƒ์„ ์ด์šฉํ•˜์—ฌ ํ•™์Šตํ•œ๋‹ค. ์ฃผ์–ด์ง„ ์ž…๋ ฅ์— ๋Œ€ํ•œ ์ถœ๋ ฅ๊ณผ ์ •๋‹ต ํ–‰๋™์ด ์ฃผ์–ด์ง€์ง€ ์•Š์œผ๋ฉฐ, ์ฃผ์š” ์‘์šฉ ๋ถ„์•ผ๋กœ๋Š” ๊ฒŒ์ž„, ๋„ค๋น„๊ฒŒ์ด์…˜, ๋กœ๋ด‡ ๋“ฑ์ด ์žˆ๋‹ค.

 

 

 

 

# ๋จธ์‹ ๋Ÿฌ๋‹์˜ ํ•™์Šต๋ฒ•๊ณผ ํ™œ์šฉ ๋ถ„์•ผ ์ฒด๊ณ„