728x90

MI Lab 37

[단어 연관도 - Lab meeting] Word2Vec - 2021.11.22.월

단어의 연관도를 분석하는 인공지능을 탐색하던 중 Word2Vec라는 알고리즘을 발견하여 공부해보았다. 단어를 벡터로 표현하면, 벡터 연산이 가능해진다. 벡터 연산을 하면 앞에서 봤던 것처럼 ‘king – man + woman = queen’이라는 연산이 가능해진다. (단, 벡터가 단어의 의미를 잘 표현하고 있을 경우에 가능) - 단어를 여러 차원에 분산하여 표현했을 때의 장점 1) 적은 차원으로 대상을 표현할 수 있다. 원핫인코딩처럼 표현하면 단어의 수만큼 차원을 사용하지만, word2vec처럼 표현하면 차원의 크기를 설정하여 거기에 맞춰서 벡터가 표현된다. 보통 20~200차원 정도 사용. 2) 입력 데이터에 0이 많으면 데이터에서 정보를 뽑아내기 어렵지만, 각각의 차원이 모두 정보를 가지고 있으면 모..

[단어 연관도 - Lab meeting] 영단어 추천 사례 - 2021.11.08.월

영단어 추천 공부로 연구 과제를 변경하기로 한 만큼, 그에 관련된 사례를 찾아보고 아이디어를 다시 계획 및 구체화시키는 시간을 가졌다. 애초에 만들고자 한 것은 사용자의 검색 기록 등을 분석하여 어떤 분야에 관심이 있고 어떤 분야의 영어 공부가 우선적으로 필요한지 파악한 후 영단어를 추천해주는 것이었다. 하지만 실력적으로 구현하기에 어려운 부분이 있어 영어단어를 카테고리별로 분류하고, 사용자가 카테고리를 선택하여 영단어를 암기할 수 있도록 하는 방향으로 생각 중이었다. 그런데 사례를 찾아보고 아이디어를 다시 구상해보니, 사용자가 초반에 영어단어를 선택하면, 그 영어단어와 연관성이 있는 영어단어를 단어장에 추가 및 추천해주는 방향으로 구현하는 것도 좋겠다는 생각이 들었다. 교수님과의 면담을 통해서도 이런 ..

[단어 연관도 - Lab meeting] 연구 과제 변경 - 2021.11.01.월

CPM 논문 내용이 너무 어렵고, 아직 Kinect 기기도 준비되지 않아서 그 전까지 창업동아리 활동으로 하고 있는 영단어 추천앱의 인공지능 부분을 공부하면 안 될지 교수님과 면담했다. 교수님께서 CPM 내용이 어려우면 안 하는 거는 좋지만, 영단어 추천을 함으로써 가치가 있는지 구체적인 생각과 계획적인 부분을 고민해봐야 한다고 말씀하셨다. 다음 랩미팅까지 다른 사례들을 많이 찾아보고 어떤 걸 만들고 싶은지 구체적으로 발표하고자 한다. 이전까지 창업동아리 활동을 하면서 React Native 공부를 한다는 핑계로 모든 일을 너무 미루기만 했던 것 같다. 앱 개발이나 인공지능, 서버, 데이터베이스 부분 중 뭐 하나 제대로 되어있는 것이 없다는 사실이 자괴감 들고 스스로 한심하게 느껴졌다. 지금이라도 무언가..

[단어 연관도 분석] Word2Vec > skip-gram

▶ Word2Vec 정리 https://coding-ga-ding.tistory.com/123 [단어 연관도 분석] Word2Vec 인공지능을 이용해 영어 단어의 연관성을 분석하고, 그 분석 정보를 바탕으로 영어 단어를 입력했을 때 함께 공부하면 도움이 될 영어단어를 추천해주는 앱을 개발하려고 한다. 그 과정에서 인 coding-ga-ding.tistory.com 위 링크의 Word2vec 정리에서 CBOW에 대해서는 어느 정도 개념적으로 이해를 했는데, skip-gram은 CBOW의 반대라는 것 말고는 자세히 공부하지 않아서 따로 공부를 해보려고 한다. skip-gram을 공부하기 전 CBOW를 간단히 정리하며 비교해보자. - 주변 단어들을 통해서 중간을 예측하는 모델 - 주변 단어가 ..

[단어 연관도 분석] Word2Vec

인공지능을 이용해 영어 단어의 연관성을 분석하고, 그 분석 정보를 바탕으로 영어 단어를 입력했을 때 함께 공부하면 도움이 될 영어단어를 추천해주는 앱을 개발하려고 한다. 그 과정에서 인공지능 부분을 맡게 되면서 인공지능을 이용해 영어 단어의 연관성을 찾는 방법에 대해 공부를 하고 있다. 단어의 연관성 탐색을 하는 인공지능 알고리즘 중에 Word2Vec라는 알고리즘이 있기에 깊이 공부해보려 한다. ▶ Word2Vec란? - 신경망을 기반으로 한 비지도 학습 알고리즘 - 자동으로 단어 사이의 관계를 학습한다. - Word2Vec 아이디어: 비슷한 의미를 가진 단어를 비슷한 클러스터*로 모으는 것 - Word2Vec에서 만든 벡터 공간을 이용하면 간단한 벡터 연산으로 단어를 생성할 수 있다. 예) king -..

728x90