딥러닝(2)
-
[개념/IT]물체의 관계를 주목해 정보를 처리하는 트랜스포머
💡 개념 요약트랜스포머(Transformer)는 2017년 구글이 발표한 논문 *“Attention is All You Need”*에서 처음 소개됨.기존 RNN, LSTM 기반 시퀀스 모델이 가진 연산 병렬화 문제와 장기 의존성 문제를 해결하기 위해 제안된 구조임.트랜스포머는 입력 시퀀스의 각 요소 간 관계를 '어텐션'으로 계산해 병렬 처리 가능하고, 긴 문맥도 효과적으로 학습 가능함.현재 자연어 처리(NLP)를 넘어 컴퓨터 비전, 음성 인식 등 다양한 분야에 폭넓게 사용되고 있음. ❓ 내가 가졌던 의문“BERT나 GPT가 트랜스포머 기반이라는데, 트랜스포머가 뭐고 어떻게 학습되는 걸까?”처음엔 그냥 RNN이랑 비슷한 줄 알았음. 그런데 학습은 더 빠르고, 결과는 더 좋다고 해서 궁금해짐.GPT가 '언..
2025.06.10 -
[개념/IT]위조범과 감별사의 끝없는 대결_GAN
💡 개념 요약언제, 누가, 왜 개발했는지GAN은 2014년, Ian Goodfellow가 제안한 인공지능 생성 모델입니다. 목적은 실제와 구분이 어려운 데이터를 생성하는 것!무엇을 해결하기 위한 기술인지기존의 생성 모델들이 데이터 분포를 제대로 배우기 어려웠는데, GAN은 두 네트워크의 경쟁 구조로 이를 효과적으로 학습하게 만들었다.지금 어디에 쓰이고 있는지딥페이크 영상/이미지그림/사진 생성데이터 증강 (특히 의료 영상)스타일 변환(예: 낮 → 밤 이미지 변환)❓ 내가 가졌던 의문“GAN은 두 개의 모델이 경쟁한다고 들었는데, 정확히 어떻게 학습되는 거지?”GPT랑 대화하면서 알게 된 흐름을 요약하면 아래와 같다:GAN은 Generator(생성자)와 Discriminator(판별자) 두 모델로 구성돼...
2025.06.10