728x90
이번 Lab meeting에서는 word2vec를 학습할 때 어떤 데이터를 사용해야 할지에 대해 공부하고 발표해보았다.
불용어를 제거하지 않았을 경우에는, 해당 단어가 크게 의미를 가지지 않은 단어임에도 불구하고 다른 단어와의 연관성이 있다고 판단될 수 있다. 또한 의미없는 단어까지 학습하게 된다는 점에서 불필요한 시간이 소요될 수 있다.
이제는 직접 코드를 작성하고 실행해보는 작업을 해보아야 할 것 같다.
728x90
'MI Lab > Word2Vec - 2021.11~2022.01' 카테고리의 다른 글
[단어 연관도 - Lab meeting] 동시 출현 기반 - 2022.01.20.목 (0) | 2022.01.25 |
---|---|
[단어 연관도 - Lab meeting] word2vec 활용 - 2022.01.11.화 (0) | 2022.01.25 |
[단어 연관도 분석] gensim 설치 (0) | 2022.01.03 |
[단어 연관도 - Lab meeting] 연관어 분석 방법 - 2021.12.28.화 (0) | 2021.12.29 |
[단어 연관도 - Lab meeting] CBOW와 skip-gram - 2021.12.06.월 (0) | 2021.12.27 |