- PPT 한 장 분량으로 논문 정리

- 이해가 안 가는 부분, 이해가 안 가는 이유
- Dropout 적용에 있어서 l2 norm 적용 및 masking vector Bernoulli random variables
- (관련 개념들이 헷갈리는 것 같음..)
- 재밌었던 부분
- 문장 (혹은 문서)을 2차원으로 표현하는 아이디어
- 한계로 느껴지는 부분
- 논문 구현 시 주의해야할 것 같은 부분
- word2vec 모델에 없는 단어의 초기화시, 기존 모델의 벡터들과 같은 분산을 같게 하는 것?
- multichannel 방법에 대해서 gradient update
- 같이 얘기해봤으면 하는 부분
- (페이퍼 리뷰 후에) 느낀점. 새로 알게 된 점
- 구현을 생각하면서 읽다보니 예전에는 고민하지 않았던 것들을 고민하게 되었음.
- 심플한 아이디어와 실험으로 큰 임팩트를 준 점이 좋았음.