728x90

Lab Meeting 26

[단어 연관도 - Lab meeting] Skip-gram 활용 사례 - 2021.11.29.월

이전 랩미팅에서 CBOW 설명 시 사용했던 단어 2차원 그래프가 어떻게 나온 것인지 실제 코드를 보며 공부를 해보았다. 해당 코드는 아마존의 휴대폰 관련 리뷰 댓글을 입력 데이터로 받아 단어 간의 연관성을 분석한 것이다. CBOW를 설명할 때 해당 그래프를 사용했는데, 이 코드는 skip-gram을 이용한 것이었다. 그리고 알고보니 CBOW보다 skip-gram의 성능이 더 좋아서 많이 사용된다고 한다. +) 참고 https://nbviewer.org/github/dreamgonfly/phone-review-nlp/blob/master/phone_reviews_nlp.ipynb#Modern-NLP-on-mobile-phone-reviews Jupyter Notebook Viewer You can find..

[단어 연관도 - Lab meeting] Word2Vec - 2021.11.22.월

단어의 연관도를 분석하는 인공지능을 탐색하던 중 Word2Vec라는 알고리즘을 발견하여 공부해보았다. 단어를 벡터로 표현하면, 벡터 연산이 가능해진다. 벡터 연산을 하면 앞에서 봤던 것처럼 ‘king – man + woman = queen’이라는 연산이 가능해진다. (단, 벡터가 단어의 의미를 잘 표현하고 있을 경우에 가능) - 단어를 여러 차원에 분산하여 표현했을 때의 장점 1) 적은 차원으로 대상을 표현할 수 있다. 원핫인코딩처럼 표현하면 단어의 수만큼 차원을 사용하지만, word2vec처럼 표현하면 차원의 크기를 설정하여 거기에 맞춰서 벡터가 표현된다. 보통 20~200차원 정도 사용. 2) 입력 데이터에 0이 많으면 데이터에서 정보를 뽑아내기 어렵지만, 각각의 차원이 모두 정보를 가지고 있으면 모..

[단어 연관도 - Lab meeting] 영단어 추천 사례 - 2021.11.08.월

영단어 추천 공부로 연구 과제를 변경하기로 한 만큼, 그에 관련된 사례를 찾아보고 아이디어를 다시 계획 및 구체화시키는 시간을 가졌다. 애초에 만들고자 한 것은 사용자의 검색 기록 등을 분석하여 어떤 분야에 관심이 있고 어떤 분야의 영어 공부가 우선적으로 필요한지 파악한 후 영단어를 추천해주는 것이었다. 하지만 실력적으로 구현하기에 어려운 부분이 있어 영어단어를 카테고리별로 분류하고, 사용자가 카테고리를 선택하여 영단어를 암기할 수 있도록 하는 방향으로 생각 중이었다. 그런데 사례를 찾아보고 아이디어를 다시 구상해보니, 사용자가 초반에 영어단어를 선택하면, 그 영어단어와 연관성이 있는 영어단어를 단어장에 추가 및 추천해주는 방향으로 구현하는 것도 좋겠다는 생각이 들었다. 교수님과의 면담을 통해서도 이런 ..

[단어 연관도 - Lab meeting] 연구 과제 변경 - 2021.11.01.월

CPM 논문 내용이 너무 어렵고, 아직 Kinect 기기도 준비되지 않아서 그 전까지 창업동아리 활동으로 하고 있는 영단어 추천앱의 인공지능 부분을 공부하면 안 될지 교수님과 면담했다. 교수님께서 CPM 내용이 어려우면 안 하는 거는 좋지만, 영단어 추천을 함으로써 가치가 있는지 구체적인 생각과 계획적인 부분을 고민해봐야 한다고 말씀하셨다. 다음 랩미팅까지 다른 사례들을 많이 찾아보고 어떤 걸 만들고 싶은지 구체적으로 발표하고자 한다. 이전까지 창업동아리 활동을 하면서 React Native 공부를 한다는 핑계로 모든 일을 너무 미루기만 했던 것 같다. 앱 개발이나 인공지능, 서버, 데이터베이스 부분 중 뭐 하나 제대로 되어있는 것이 없다는 사실이 자괴감 들고 스스로 한심하게 느껴졌다. 지금이라도 무언가..

728x90