728x90

전체 265

[단어 연관도 - Lab meeting] 연관어 분석 방법 - 2021.12.28.화

이번주는 Word2Vec 이외에 연관어를 분석하는 방법 2가지를 공부해보았다. 같은 단어 쌍(순서 무관)이 여러번 등장할수록 연관되어 있다고 보는 '동시 출현 기반 연관어 분석' 방법이 있다. 가중치를 활용한 '통계적 가중치 기반 연관어 분석' 방법이 있는데, 이 방법에서 가중치를 이용해 유사도를 계산하는 수식이 3가지 정도 존재한다.(더 존재할수도 있지만 내가 발견한 글에는 대표적으로 3가지가 설명되어 있었다) 수식을 자세히 보지도 않고 어려워 보여서 건너뛰었는데, 교수님이 해당 수식은 어려운 것이 아니라고 하셨다. 나중에 자세히 보면서 공부할 필요가 있을 것 같다. 연관어 분석에서 단어별 중요성을 파악하는 데 쓰이는 중심성 계수에 대해서도 공부해보았다. 교수님과 대화를 나누다보니 이 부분은 이해가 확..

[코딩 테스트] 코딩 테스트 연습 github 기록

지금까지 코딩 테스트 연습을 하면서 백준 문제 푼 코드를 Tistory에만 정리해두었는데, 이번에 github repository를 만들어서 모두 정리해두었다. 아직 백준 문제 뿐이지만 이후 다른 곳의 문제를 풀더라도 이 repository에 한 번에 저장해두려고 한다. https://github.com/jung0115/CodingTestPractice.git GitHub - jung0115/CodingTestPractice: Practice Coding Test with Beakjoon, programmers, etc. Practice Coding Test with Beakjoon, programmers, etc. - GitHub - jung0115/CodingTestPractice: Practice ..

Programming/etc. 2021.12.29

[백준] 단계별로 풀어보기 > 기본 수학2 (Java)

+) 풀이 코드 https://github.com/jung0115/CodingTestPractice.git GitHub - jung0115/CodingTestPractice: Practice Coding Test with Beakjoon, programmers, etc. Practice Coding Test with Beakjoon, programmers, etc. - GitHub - jung0115/CodingTestPractice: Practice Coding Test with Beakjoon, programmers, etc. github.com +) 백준에 Java 코드를 제출할 때는 class명을 Main으로 해주어야 오류가 발생하지 않는다. 1978번 - 2021.12.29.수 import ja..

Programming/JAVA 2021.12.29

[Java] vscode에서 java 프로그래밍 하기

2학년 2학기 전공선택 과목으로 java 프로그래밍을 배웠는데, 그때는 이클립스로 프로그래밍을 했다. 이후 혼자 공부를 해보면서 이클립스 말고 vscode로 프로그래밍을 하고 싶어져서 방법을 찾아보았다.(찾아보기 전까지 java는 이클립스로만 가능한줄 알았다...) 일단 나는 이클립스를 사용하고 있었기 때문에 JDK를 설치하고 환경변수를 설정하는 과정까지 완료되어 있었다. (사실 React Native를 사용할 때도 JDK를 설치하라고 해서 이미 그때 다 설정해둔 상태였다) 당연히 vscode도 사용하고 있었기에 설치가 되어있었다. vscode에서 java를 사용하기 위해서는 크게 아래 4단계를 거쳐야 한다. 1) JDK 설치 2) JDK 환경변수 설정 3) VSCode 설치 4) VSCode에 Java..

Programming/JAVA 2021.12.29

[단어 연관도 - Lab meeting] Skip-gram 활용 사례 - 2021.11.29.월

이전 랩미팅에서 CBOW 설명 시 사용했던 단어 2차원 그래프가 어떻게 나온 것인지 실제 코드를 보며 공부를 해보았다. 해당 코드는 아마존의 휴대폰 관련 리뷰 댓글을 입력 데이터로 받아 단어 간의 연관성을 분석한 것이다. CBOW를 설명할 때 해당 그래프를 사용했는데, 이 코드는 skip-gram을 이용한 것이었다. 그리고 알고보니 CBOW보다 skip-gram의 성능이 더 좋아서 많이 사용된다고 한다. +) 참고 https://nbviewer.org/github/dreamgonfly/phone-review-nlp/blob/master/phone_reviews_nlp.ipynb#Modern-NLP-on-mobile-phone-reviews Jupyter Notebook Viewer You can find..

[단어 연관도 - Lab meeting] Word2Vec - 2021.11.22.월

단어의 연관도를 분석하는 인공지능을 탐색하던 중 Word2Vec라는 알고리즘을 발견하여 공부해보았다. 단어를 벡터로 표현하면, 벡터 연산이 가능해진다. 벡터 연산을 하면 앞에서 봤던 것처럼 ‘king – man + woman = queen’이라는 연산이 가능해진다. (단, 벡터가 단어의 의미를 잘 표현하고 있을 경우에 가능) - 단어를 여러 차원에 분산하여 표현했을 때의 장점 1) 적은 차원으로 대상을 표현할 수 있다. 원핫인코딩처럼 표현하면 단어의 수만큼 차원을 사용하지만, word2vec처럼 표현하면 차원의 크기를 설정하여 거기에 맞춰서 벡터가 표현된다. 보통 20~200차원 정도 사용. 2) 입력 데이터에 0이 많으면 데이터에서 정보를 뽑아내기 어렵지만, 각각의 차원이 모두 정보를 가지고 있으면 모..

728x90