그림에 상세 설명이 궁금함 two channel 의 사용 등
정규화를 위해 dropout을 사용하는 이유
Pretrain word vector를 사용하여 CNN을 한다는 것과 그리고 그 CNN을 거의 튜닝하지 않는 다는 것이 인상적임
간단한데 좋은 성능을 낸다는 것과 랜덤하게 word vector를 쓰는것보다 성능이 잘나온다는 점
딥러닝 공부한지 오래되어서 CNN 기본부터 한 번 쭈욱 다시 봐야겠다고 느낌
8시가 조금 빠듯한 것도 같음
pytorch를 안한지 오래되어서 열심히 해봐야겠다
그림과 수식 그리고 논문 결론에 나온 비교 부분과 이 논문의 기법을 실사용하는 사례
데이터의 사용의 중요성 아무거나 사용하는 벡터가 아닌 word2vec을 통해 얻은 벡터의 사용과