본문 바로가기
반응형

딥러닝2

shape와 dimension 텐서?란 무엇인가 tensor example in NLP sentence hi John hi James hi Brian 단어 단위로 자른다 unique word index hi 0 John 1 James 2 Brian 3 자연어 처리에서는 원핫인코딩을 기본적으로 사용하니까 아래와 같이 각 단어를 벡터화 시키자 unique word index one hot encoding vector hi 0 [1,0,0,0] john 1 [0,1,0,0] james 2 [0,0,1,0] Brian 3 [0,0,0,1] 이렇게 워드들을 벡터로 표현할 수 있으니까 문장도 당연히 벡터로 표현할 수 있음 sentence vector representation hi John [[1,0,0,0], [0,1,0,0]] hi Jame.. 2022. 7. 13.
[쉽게 배우는 통계학] 필요 표본의 수 추측통계학은 오차라는 것을 생각해야한다! 어떻게든 일부를 조사해서 전체의 특징을 파악할 수 있게 연구하는 것이 목적! 연구자가 표본을 조사할 때는 대개 얼마나 많은 숫자를 조사하는 것일까? 기준이 있을까? 이상적인 건 모집단을 100으로 했을 때 표본 수 80정도를 조사하면 그 나름대로 정확도 높은 결과를 얻을 수 있다. 모집단이 많을 수록 필요한 표본의 수도 늘어나지만 모집단이 10,000을 넘으면 그렇게 많이 할 필요는 없다. 다만 이건 일반적인 이야기일 뿐. 예를 들어 설문조사를 할때 샘플이 400개라면 표본 오차를 5% 미만으로 하는 것이 좋다고들 하지. 하지만 설문의 목적이나 신뢰도를 얼마나 높이느냐에 따라 필요한 표본수는 달라짐. 동물실험에서는 표본수가 적어도 괜찮다. (그런데 연구 분야에 따.. 2022. 7. 10.
반응형