MI Lab/Word2Vec - 2021.11~2022.01

[단어 연관도 - Lab meeting] word2vec 학습 데이터 - 2022.01.04.화

코딩뽀시래기 2022. 1. 4. 14:29
728x90

이번 Lab meeting에서는 word2vec를 학습할 때 어떤 데이터를 사용해야 할지에 대해 공부하고 발표해보았다.

1
2
3

불용어를 제거하지 않았을 경우에는, 해당 단어가 크게 의미를 가지지 않은 단어임에도 불구하고 다른 단어와의 연관성이 있다고 판단될 수 있다. 또한 의미없는 단어까지 학습하게 된다는 점에서 불필요한 시간이 소요될 수 있다.

4

 

이제는 직접 코드를 작성하고 실행해보는 작업을 해보아야 할 것 같다.

728x90