โ๏ธ Kibwa Voice Phishing Prev Project12 [Natural Language Processing Model] KOBERT ์๋ฌ ๊ธฐ๋ก & ์ ๋ฆฌ ๐ฅ KOBERT Code ์ถ์ฒ ๋ฐ ์ด์ฉ ์ ์ฐธ๊ณ ์๋ฃ --> https://bbarry-lee.github.io/ai-tech/KoBERT%EB%A5%BC-%ED%99%9C%EC%9A%A9%ED%95%9C-%EA%B0%90%EC%A0%95%EB%B6%84%EB%A5%98-%EB%AA%A8%EB%8D%B8-%EA%B5%AC%ED%98%84.html KoBERT๋ฅผ ํ์ฉํ ๊ฐ์ ๋ถ๋ฅ ๋ชจ๋ธ ๊ตฌํ with Colab ์๋ ํ์ธ์, Daisy ์ ๋๋ค โบ๏ธ SKT Brain์์ ๊ฐ๋ฐํ KoBERT ์คํ์์ค ์ฝ๋๋ฅผ ํ์ฉํด Google Colab์์ ๊ฐ์ ๋ถ๋ฅ ๋ชจ๋ธ์ ๊ตฌํํด๋ณด์์ผ๋ฉฐ ๊ทธ ๊ณผ์ ์ ์๊ฐํ๊ณ ์ ํฉ๋๋ค. bbarry-lee.github.io --> https://github.com/SKTBrain/KoBERT GitH.. 2023. 7. 1. [Data Processing] ๋ฐ์ดํฐ ์ฆ๊ฐ(Data Augmentation) ๊ด๋ จ ๊ฐ๋ ๋ฐ ๊ธฐ๋ฒ ์กฐ์ฌ ๐ ๋ฐ์ดํฐ ์ฆ๊ฐ(Data Augmentation) ์ด๋? ๋ฐ์ดํฐ ์ฆ๊ฐ(Data Augmentation)์ ๊ธฐ๊ณ ํ์ต๊ณผ ๋ฅ๋ฌ๋ ๋ชจ๋ธ์ ์ฑ๋ฅ์ ํฅ์์ํค๊ธฐ ์ํด ๊ธฐ์กด์ ํ์ต ๋ฐ์ดํฐ๋ฅผ ๋ณํ, ์กฐ์ ๋๋ ํ์ฅ์ํค๋ ๊ธฐ๋ฒ์ด๋ค. ๋ฐ์ดํฐ ์ฆ๊ฐ(Data Augmentation)์ ์ ํ๋ ํ์ต ๋ฐ์ดํฐ๋ฅผ ๋ค์ํ๊ณ ํ๋ถํ ๋ฐ์ดํฐ๋ก ํ์ฅ์ํด์ผ๋ก์จ ๋ชจ๋ธ์ ์ผ๋ฐํ ์ฑ๋ฅ์ ํฅ์์ํค๊ณ , ๊ณผ์ ํฉ์ ๋ฐฉ์งํ๋ ๋ฐ ๋์์ ์ค ์ ์๋ค. ๐ About ๋ฐ์ดํฐ ์ฆ๊ฐ(Data Augmentation) 1. ๋ฐ์ดํฐ ์ฆ๊ฐ ๊ธฐ๋ฒ ๋ฌธ๋ฒ ๋ณํ ๋์์ด & ์ ์์ด ๊ต์ฒด ๋ฌธ์ฅ ์ฌ๊ตฌ์ฑ (๋ฌธ์ฅ ๊ฐ ์์ ๊ต์ฒด) ํ ์ธ์ด๋ก ๋ฒ์ญ ํ ๋ค์ ํ๊ท ์ค๊ฐ๋ถ ๋จ์ด ์ฝ์ ์ค๊ฐ๋ถ ๋จ์ด ์ญ์ 2. ๋ฐ์ดํฐ ์ฆ๊ฐ ์์ 1๏ธโฃ ๋ฌธ๋ฒ ๋ณํ ๋ค, ์ฐ์ ์ ํตํ์๋ถ๊ป์ ์ด๋ฒ ์ฌ๊ฑด์ ์ฐ๋ฃจ๋ ํ์.. 2023. 6. 25. [Data Processing] STT ๋ฐ์ดํฐ ๋ค์ด๋ก๋๋ฅผ ์ํ ์๋ํ ์คํฌ๋ฆฝํธ ์์ฑ ๐ STT ๋ฐ์ดํฐ ๋ค์ด๋ก๋๋ฅผ ์ํ ์๋ํ ์คํฌ๋ฆฝํธ ์์ฑ โ pip ๋ช ๋ น์ด๋ฅผ ํตํด boto3 ํจํค์ง ์ค์น & boto3 ๋ชจ๋ ์ํฌํธ !pip install boto3 import boto3 โป boto3 ๋? AWS ์๋น์ค์ ์ํธ์์ฉํ๊ธฐ ์ํด ์ฌ์ฉํ๋ Python SDK --> ์ํฌํธํ boto3 ์ด ๋ชจ๋์ ์ฌ์ฉํ์ฌ AWS S3 ํด๋ผ์ด์ธํธ๋ฅผ ์์ฑํ๊ณ ํ์ผ์ ๋ค์ด๋ก๋ํ ์ ์์ โก AWS ๊ณ์ ์๊ฒฉ ์ฆ๋ช ๊ณผ AWS ๋ฆฌ์ ์ค์ # AWS ๊ณ์ ์๊ฒฉ ์ฆ๋ช ๋ฐ AWS ๋ฆฌ์ ์ค์ aws_access_key_id = "๊ณ์ ์ ์์ธ์ค ํค๊ฐ" aws_secret_access_key = "๊ณ์ ์ ์ํฌ๋ฆฟ ์์ธ์ค ํค๊ฐ" aws_region = "๊ณ์ ์ AWS Region" โป AWS ๋ฆฌ์ (Region) ์ด๋? : AWS ํด๋ผ์ฐ.. 2023. 6. 23. [Natural Language Processing Model] KOBERT์ Finetuning ์ค์ต ๐ KOBERT ๋? KOBERT๋ Korean Bidirectional Encoder Representations from Transformers์ ์ฝ์๋ก, SKT Brain์์ ๊ณต๊ฐํ ์ผ์ข ์ ๊ธฐ๊ณ๋ฒ์ญ ๋ชจ๋ธ์ด๋ค. KOBERT๋ 2018๋ Google ์์ ๋ฐํํ "BERT"์ ํ๊ตญ์ด ๋ฒ์ ๋ชจ๋ธ๋ก์ ํ ์คํธ ๋ถ๋ฅ, ๊ฐ์ฒด๋ช ์ธ์, ๊ฐ์ ๋ถ์, ๊ธฐ๊ณ ๋ฒ์ญ ๋ฑ์ ์์ฐ์ด ์ฒ๋ฆฌ(Natural Language Processing) ์์ ์์ ๋ฐ์ด๋ ์ฑ๋ฅ์ ๋ฐํํ ์ ์๋ค. ๐ KOBERT Finetuning ์ค์ต 1. ํ์ด์ฌ ๋ฉ์ธ ํจํค์ง ์ค์น # ํตํฉ ๊ฐ๋ฐ ํ๊ฒฝ์ ์ํ ipywidgets ํจํค์ง ์ค์น !pip install ipywidgets # GitHub ์ ์ฅ์์์ ์ต์ ๋ฒ์ ์ KOBERT๋ฅผ ๋ถ๋ฌ์ ์ค์น !pip .. 2023. 6. 3. [Project Development & Ideas] ํ๋ก์ ํธ ๋ฐ์ _์๊ฐ ์ฅ์ ์ธ ๋ถ๋ค์ ์ํ ์ถ๊ฐ ์์ด๋์ด ์ ์ # ํ๋ก์ ํธ ๋ฐ์ _์๊ฐ ์ฅ์ ์ธ ๋ถ๋ค์ ์ํ ์ถ๊ฐ ์์ด๋์ด ์ ์ 1. ์ฑ์์ ๋ณด์ด์คํผ์ฑ ํ๋ณ ๊ฒฐ๊ณผ๋ฅผ ์์ฑ์ผ๋ก ์๋ด : App ์ ์ ์ ์์ฑ ์ถ๋ ฅ ๊ธฐ๋ฅ ์ถ๊ฐ A. ์์ฑ ํฉ์ฑ API ์ฌ์ฉ --> API๋ฅผ ์ฌ์ฉํ์ฌ ํ ์คํธ๋ฅผ ์์ฑ์ผ๋ก ๋ณํํ๊ณ , ์น ์ฑ์์ ํด๋น ์์ฑ์ ์ฌ์ํ ์ ์์ ๋ํ์ ์ธ ์์ฑ ํฉ์ฑ API Google Cloud Text-to-Speech Microsoft Azure Text-to-Speech Amazon Polly B. JavaScript์ Web Audio API : ์น ์ฑ์ ํด๋ผ์ด์ธํธ ์ธก์์ JavaScript์ Web Audio API๋ฅผ ์ฌ์ฉํ์ฌ ์์ฑ์ ์์ฑํ๊ณ ์ฌ์ํ ์ ์์. ์ด๋ฅผ ํตํด ํ ์คํธ๋ฅผ ์์ฑ์ผ๋ก ๋ณํํ๊ณ , ์น ์ฑ์์ ํด๋น ์์ฑ์ ์ถ๋ ฅํ ์ ์์ --> ์๋ฅผ ๋ค์ด, Text-.. 2023. 5. 28. [Data Processing] 1. ์์ฑ ๋ฐ์ดํฐ ์์ง์ ์ํ ์น ํฌ๋กค๋ง ์คํฌ๋ฆฝํธ ์์ฑ ๐ฅ ์์ฑ ๋ฐ์ดํฐ ์์ง์ ์ํ ์น ํฌ๋กค๋ง ์คํฌ๋ฆฝํธ ์์ฑ ๋จธ์ ๋ฌ๋์ ์ํ ๋ฐ์ดํฐ์ ์ ํ๋ณดํ๋ ๊ณผ์ ์์ ๋ค์ด๋ฐ์์ผ ํ ํ์ผ์ ์๊ฐ ๋ง์, ์๋์ผ๋ก ์์ฑ ํ์ผ๋ค์ ๋ค์ด๋ก๋ํ ์ ์๋ ์น ํฌ๋กค๋ง ์คํฌ๋ฆฝํธ๋ฅผ ์์ฑํ์๋ค. ์์ฑํ ์คํฌ๋ฆฝํธ๋ ์๋ 2๊ฐ์ง์ ์์๋ฅผ ๋ฐ์ํ๋๋ก ์์ฑ๋์๋ค. ๋ค์ด๋ก๋ ์ ๋ค์ด๋ ํ์ผ์ ์ด๋ฆ์ ์ง์ ํ ์ ์๋๋ก ํจ ํ์ผ์ ๋ค์ด๋ก๋ ์ ๋ฐ์ดํฐ๊ฐ ์ ์ฅ๋ ์์น๋ฅผ ์ค์ ํ ์ ์๋๋ก ํจ ์๋๋ ์์ฑํ ํฌ๋กค๋ง ์คํฌ๋ฆฝํธ์ ์์ฑํ ์ฝ๋์ ๋ํ ์ค๋ช ์ด๋ค. from selenium import webdriver from selenium.webdriver import ActionChains from selenium.webdriver.common.keys import Keys from selenium.webdri.. 2023. 5. 23. ์ด์ 1 2 ๋ค์