MI Lab/Word2Vec - 2021.11~2022.01

[단어 연관도 - Lab meeting] Skip-gram 활용 사례 - 2021.11.29.월

코딩뽀시래기 2021. 12. 27. 14:27
728x90

이전 랩미팅에서 CBOW 설명 시 사용했던 단어 2차원 그래프가 어떻게 나온 것인지 실제 코드를 보며 공부를 해보았다.

 

해당 코드는 아마존의 휴대폰 관련 리뷰 댓글을 입력 데이터로 받아 단어 간의 연관성을 분석한 것이다. CBOW를 설명할 때 해당 그래프를 사용했는데, 이 코드는 skip-gram을 이용한 것이었다. 그리고 알고보니 CBOW보다 skip-gram의 성능이 더 좋아서 많이 사용된다고 한다.

1
2
3
4
5

 

+) 참고

https://nbviewer.org/github/dreamgonfly/phone-review-nlp/blob/master/phone_reviews_nlp.ipynb#Modern-NLP-on-mobile-phone-reviews

 

Jupyter Notebook Viewer

You can find some interesting patterns in this plot. First, the topics on the right side (13, 15, 17) are associated with positive terms (good, great, awesome). Conversely, the topics on the left side are about technical terms, and some of them are about i

nbviewer.org

 

728x90