본문 바로가기 메뉴 바로가기

dive in

프로필사진
  • 글쓰기
  • 관리
  • 태그
  • 방명록
  • RSS

dive in

검색하기 폼
  • 분류 전체보기 (4)
    • 통계 (1)
    • Concepts (0)
    • Machine Learning-Deep Learn.. (1)
      • Natural Language Processing (1)
      • Computer Vision (0)
      • Time Series (0)
      • Anomaly Detection (0)
      • XAI (0)
    • Medical Informatics (0)
  • 방명록

Machine Learning-Deep Learning/Natural Language Processing (1)
[논문 리뷰] Transformer : Attention Is All You Need

[Transformer의 출현 배경]기존의 순환 신경망(RNN)은 입력 및 출력 시퀀스를 시간 단계(time step)에 따라 순차적으로 처리한다. 이러한 특성 때문에 모든 시간 단계의 출력을 동시에 병렬로 계산할 수 없고, 반드시 이전 단계가 계산된 후에야 다음 단계의 연산이 가능하다. 이로 인해 계산 속도가 느려질 수 밖에 없다. 또한, 긴 시퀀스를 처리하기 위해서는 각 시간 단계의 중간 상태(hidden state)와 그래디언트(gradient)를 모두 저장해야한다. 이는 순환 모델의 구조적 특성 때문인데, RNN은 현재 시간 단계의 출력을 계산할 때, 반드시 이전 시간 단계의 hidden state를 입력으로 받아야 한다. 즉, 각 시간 단계의 출력이 이전 단계의 상태에 의존하는 구조이기 때문에,..

Machine Learning-Deep Learning/Natural Language Processing 2025. 2. 13. 01:44
이전 1 다음
이전 다음
공지사항
최근에 올라온 글
최근에 달린 댓글
Total
Today
Yesterday
링크
TAG
  • 귀무가설 #대립가설 #p-value #검정통계량
  • HTML #tag #w3schools #WEB #생활코딩 #egoing
  • 고정환율제도 #기축통화 #변동환율제도 #관리변동환율제도 #외환보유고 #디폴트 #가산금리 #spread #선도환 #선물환 #스왑포인트 #swappoint #채권투자 #달러 #금리인상 #금리인하 #금리역전
more
«   2025/05   »
일 월 화 수 목 금 토
1 2 3
4 5 6 7 8 9 10
11 12 13 14 15 16 17
18 19 20 21 22 23 24
25 26 27 28 29 30 31
글 보관함

Blog is powered by Tistory / Designed by Tistory

티스토리툴바