์ธํ”„๋Ÿฐ ์˜๋ฌธ ๋ธŒ๋žœ๋“œ ๋กœ๊ณ 
์ธํ”„๋Ÿฐ ์˜๋ฌธ ๋ธŒ๋žœ๋“œ ๋กœ๊ณ 

[PyTorch] ์‰ฝ๊ณ  ๋น ๋ฅด๊ฒŒ ๋ฐฐ์šฐ๋Š” ๋”ฅ๋Ÿฌ๋‹

๋”ฅ๋Ÿฌ๋‹์˜ ๊ธฐ๋ณธ ๋ผˆ๋Œ€์ธ MLP๋ถ€ํ„ฐ CNN, RNN๊นŒ์ง€ ์‰ฝ๊ณ  ๋น ๋ฅด๊ฒŒ ๋ฐฐ์›Œ๋ด…๋‹ˆ๋‹ค.

Thumbnail

์ค‘๊ธ‰์ž๋ฅผ ์œ„ํ•ด ์ค€๋น„ํ•œ
[๋ฐ์ดํ„ฐ ๋ถ„์„] ๊ฐ•์˜์ž…๋‹ˆ๋‹ค.

์ด๋Ÿฐ ๊ฑธ ๋ฐฐ์šธ ์ˆ˜ ์žˆ์–ด์š”

  • PyTorch ๊ธฐ๋ณธ ํ…Œํฌ๋‹‰

  • Neural network ์— ๋Œ€ํ•œ ์ง€์‹

  • ๋”ฅ๋Ÿฌ๋‹์— ๋Œ€ํ•œ ๊ธฐ๋ณธ ์ง€์‹

  • CNN, RNN์— ๋Œ€ํ•œ ๊ฐœ๋…

  • Pytorch๋ฅผ ํ™œ์šฉํ•˜์—ฌ ๋”ฅ๋Ÿฌ๋‹ ๋ชจ๋ธ ๋””์ž์ธ ํ•˜๋Š”๋ฒ•

  • CNN(ResNet)์„ ์ด์šฉํ•œ cifar10 ์ด๋ฏธ์ง€ ๋ถ„๋ฅ˜ ๋ชจ๋ธ ๊ตฌ์ถ•

  • RNN์„ ํ™œ์šฉํ•œ ์˜ํ™”๋ฆฌ๋ทฐ ์˜ˆ์ธก ๋ชจ๋ธ ๊ตฌ์ถ•

  • Transfer Learning/AutoEncoder/๋”ฅ๋Ÿฌ๋‹ ๋…ผ๋ฌธ๋ฆฌ๋ทฐ

  • Model Generalization

๐Ÿ™†๐Ÿปโ€โ™€ ๋”ฅ๋Ÿฌ๋‹์˜ ๊ธฐ๋ณธ ๋ผˆ๋Œ€์ธ MLP๋ถ€ํ„ฐ CNN, RNN๊นŒ์ง€ ์‰ฝ๊ณ  ๋น ๋ฅด๊ฒŒ ๋ฐฐ์›Œ๋ด…๋‹ˆ๋‹ค.๐Ÿ™†๐Ÿปโ€โ™‚

์ธํ”„๋Ÿฐ์—์„œ ๊ฐ•์˜ํ•œ ๋‚ด์šฉ์„ ์ •๋ฆฌํ•˜์—ฌ 'ํŒŒ์ด์ฌ ๋”ฅ๋Ÿฌ๋‹ ํŒŒ์ดํ† ์น˜' ๋ผ๋Š” ์ฑ…์œผ๋กœ ์ถœ๊ฐ„ํ•˜์˜€์Šต๋‹ˆ๋‹ค.

๋งŽ์€ ๊ด€์‹ฌ ๋ถ€ํƒ๋“œ๋ฆฝ๋‹ˆ๋‹ค : ) 

(2020.10.06 ๊ธฐ์ค€ ์ธํ”„๋Ÿฐ ๊ฐ•์˜ ์—…๋ฐ์ดํŠธ ๋˜์—ˆ์Šต๋‹ˆ๋‹ค. ์ง€์†์ ์ธ ๊ฐ•์˜ ์—…๋ฐ์ดํŠธ ํ•˜๋„๋ก ํ•˜๊ฒ ์Šต๋‹ˆ๋‹ค)

http://m.yes24.com/Goods/Detail/93376077?ozsrank=10

http://mbook.interpark.com/shop/product/detail?prdNo=339742291&is1=book&is2=product

PyTorch๋กœ ์‰ฝ๊ณ  ๋น ๋ฅด๊ฒŒ ๋ฐฐ์šฐ๋Š” ๋”ฅ๋Ÿฌ๋‹

๐Ÿ—’ ๊ฐ•์˜์—…๋ฐ์ดํŠธ

 - PyTorch์— ์ต์ˆ™์น˜ ์•Š์€ ์‚ฌ๋žŒ๋“ค์„ ์œ„ํ•˜์—ฌ PyTorch background ๊ฐ•์˜(1์‹œ๊ฐ„๊ฐ€๋Ÿ‰)๋ฅผ ์ถ”๊ฐ€ํ•˜์˜€์Šต๋‹ˆ๋‹ค.

 - ๋…ผ๋ฌธ ๋ฆฌ๋ทฐ ๊ฐ•์˜(1์‹œ๊ฐ„)๋ฅผ ์ถ”๊ฐ€ํ•˜์˜€์Šต๋‹ˆ๋‹ค.


๐Ÿ—’ ๊ฐ•์˜์†Œ๊ฐœ

์š”์ฆ˜์— ์ด์•ผ๊ธฐํ•˜๋Š” ์ธ๊ณต์ง€๋Šฅ์€ ๋Œ€๋ถ€๋ถ„ ๋”ฅ๋Ÿฌ๋‹ ๋ชจ๋ธ์„ ํ™œ์šฉํ•ฉ๋‹ˆ๋‹ค. ๋”ฅ๋Ÿฌ๋‹์˜ ๊ธฐ์ดˆ๊ฐ€๋˜๋Š” Neural network๋Š” ์ƒˆ๋กœ์šด ์•Œ๊ณ ๋ฆฌ์ฆ˜์ด ์•„๋‹™๋‹ˆ๋‹ค. ์ด์ „๋ถ€ํ„ฐ ์กด์žฌํ•ด์™”๋˜ ์•Œ๊ณ ๋ฆฌ์ฆ˜์ด์ง€๋งŒ, ํ•™์Šต์˜ ํŠน์„ฑ์ƒ ๋งŽ์ด ์“ฐ์ด์ง€ ๋ชปํ–ˆ์ฃ . ์ด ๊ธฐ๋ณธ neural network๋ถ€ํ„ฐ ์‹œ์ž‘ํ•ด์„œ, ์™œ ๋”ฅ๋Ÿฌ๋‹์ด ๋œจ๊ธฐ ์‹œ์ž‘ํ–ˆ๊ณ  ๋”ฅ๋Ÿฌ๋‹์˜ ํŠน์ง•์ด ๋ฌด์—‡์ธ์ง€, ๋”๋‚˜์•„๊ฐ€ ๊ธฐ๋ณธ ๋”ฅ๋Ÿฌ๋‹๋ชจ๋ธ๋กœ ๋ถˆ๋ฆฌ์šฐ๋Š” convolution neural network, recurrent neural network์— ๋Œ€ํ•ด์„œ ํ•™์Šตํ•ฉ๋‹ˆ๋‹ค. 

๐ŸŒˆ Multi Layer Perceptron(MLP)

์ตœ์ดˆ์˜ ์ธ๊ณต์ง€๋Šฅ์ด๋ผ ๋ถˆ๋ฆฌ์šฐ๋Š” perceptron๊ณผ perceptron์˜ ํ•œ๊ณ„์ , ๊ทธ๋ฆฌ๊ณ  ์ด๋ฅผ ๊ทน๋ณตํ•œ MLP์— ๋Œ€ํ•ด์„œ ๋ฐฐ์›๋‹ˆ๋‹ค.

MLP๋Š” neural network์˜ ๊ธฐ๋ณธ ๊ตฌ์กฐ๋ผ๊ณ  ๋ณด์‹œ๋ฉด ๋ฉ๋‹ˆ๋‹ค. MLP์˜ ํ•™์Šต ์•Œ๊ณ ๋ฆฌ์ฆ˜์„ ์ฐจ๊ทผ ์ฐจ๊ทผ ์•Œ๋ ค๋“œ๋ฆฝ๋‹ˆ๋‹ค.

Feed forward์™€ back propagation์— ๋Œ€ํ•ด ์ด์•ผ๊ธฐํ•˜๊ณ  ์žฅ์ ๊ณผ ๋‹จ์ ์— ๋Œ€ํ•ด ์ด์•ผ๊ธฐํ•ฉ๋‹ˆ๋‹ค.

๐ŸŒˆ Deep Learning์— ๋Œ€ํ•œ ์ •์˜

๋”ฅ๋Ÿฌ๋‹์˜ ์ •์˜๊ฐ€ ๋ฌด์—‡์ด๊ณ  ์ผ๋ฐ˜์ ์ธ neural network์™€๋Š” ๋ฌด์—‡์ด ๋‹ค๋ฅธ ๊ฒƒ์ธ์ง€์— ๋Œ€ํ•ด ์ง‘์ค‘์ ์œผ๋กœ ๋ฐฐ์›๋‹ˆ๋‹ค.

NN์˜ ๋‹จ์ ์ธ gradient vanishing/overfitting๋ฌธ์ œ๋ฅผ ์™„ํ™”์‹œํ‚ฌ์ˆ˜ ์žˆ๋Š” activation function, drop out, Batch normalization์— ๋Œ€ํ•ด ๋‹ค๋ฃน๋‹ˆ๋‹ค.

๋‚˜์•„๊ฐ€ ๋‹จ์ˆœํžˆ ๋ถ„๋ฅ˜ ๋งŒ ํ•  ์ˆ˜ ์žˆ๋Š” ๊ฒƒ์ด ์•„๋‹ˆ๋ผ ์ƒˆ๋กœ์šด feature์— ๋Œ€ํ•ด ํ•™์Šตํ•  ์ˆ˜ ๋„ ์žˆ๋Š” Auto-Encoder์— ๋Œ€ํ•ด ๋‹ค๋ฃน๋‹ˆ๋‹ค.

๐ŸŒˆ Convolutional Neural Network (CNN)

๋”ฅ๋Ÿฌ๋‹ ์—ญ์‚ฌ๋ฅผ ๋ณด์•˜์„๋•Œ ๊ฐ€์žฅ ๋งŽ์ด ๋ฐœ์ „ํ•œ ๋ชจ๋ธ์ด ์ด CNN๋ชจ๋ธ์ด ์•„๋‹๊นŒ ์‹ถ์Šต๋‹ˆ๋‹ค. ์ด๋ฏธ์ง€๋ถ„๋ฅ˜๋กœ ์‹œ์ž‘ํ•ด์„œ ์—„์ฒญ๋‚œ ๋ฐœ์ „์„ ์ด๋ฃจ์–ด์˜จ CNN๋ชจ๋ธ์— ๋Œ€ํ•ด ๋‹ค๋ฃน๋‹ˆ๋‹ค. ํ•™์Šต ์•Œ๊ณ ๋ฆฌ์ฆ˜์˜ ํŠน์„ฑ์— ๋Œ€ํ•ด ์ด์•ผ๊ธฐํ•˜๊ณ  ์ผ๋ฐ˜์ ์ธ NN๊ณผ์˜ ์ฐจ์ด์ ์— ๋Œ€ํ•ด ๋‹ค๋ฃน๋‹ˆ๋‹ค. 

๋”๋ถˆ์–ด CNN์˜ ์„ฑ๋Šฅ์„ ๋†’์ด๊ธฐ ์œ„ํ•œ ๋‹ค์–‘ํ•œ ์•„ํ‚คํ…์ณ(Resnet, Densenet), initialization, optimizer๊ธฐ๋ฒ• ๊ทธ๋ฆฌ๊ณ  transfer learning ๋Œ€ํ•ด์„œ๋„ ์ด์•ผ๊ธฐํ•ฉ๋‹ˆ๋‹ค.

๐ŸŒˆ  Recurrent Neural Network (RNN)

ํ…์ŠคํŠธ ๋ชจ๋ธ(Language model)์˜ ๊ธฐ์ดˆ๋ชจ๋ธ์ธ RNN๊ณผ LSTM์— ๋Œ€ํ•ด ๋‹ค๋ฃน๋‹ˆ๋‹ค. 

๐ŸŒˆ  ๋”ฅ๋Ÿฌ๋‹์˜ ๋‹ค์–‘ํ•œ ๋ถ„์•ผ

๋”ฅ๋Ÿฌ๋‹์ด ์“ฐ์ด๋Š” ๋‹ค์–‘ํ•œ ๋ถ„์•ผ์— ๋Œ€ํ•ด ์ด์•ผ๊ธฐํ•ฉ๋‹ˆ๋‹ค.

๐ŸŒˆ   ๋”ฅ๋Ÿฌ๋‹์˜ Generalization

 ๋”ฅ๋Ÿฌ๋‹, ๋จธ์‹ ๋Ÿฌ๋‹ ๋“ฑ Generalization ์€ AI ์ „๋ฐ˜์ ์œผ๋กœ ๋งค์šฐ ํฐ ์ด์Šˆ์ž…๋‹ˆ๋‹ค. ์•„์ง๊นŒ์ง€๋„ ํ•ด๊ฒฐ๋˜์ง€ ์•Š์€ ๋‚œ์ œ์ด์ฃ . ๊ทธ๋ž˜์„œ ์ด๋ฅผ ํ•ด๊ฒฐ ํ•˜๊ธฐ ์œ„ํ•œ ๋‹ค์–‘ํ•œ ์—ฐ๊ตฌ๊ฐ€ ์ง„ํ–‰ ๋˜์–ด ์˜ค๊ณ  ์žˆ์Šต๋‹ˆ๋‹ค. ์ด Generlization ์— ๋Œ€ํ•œ ๋‹ค์–‘ํ•œ ์—ฐ๊ตฌ์— ๋Œ€ํ•ด์„œ๋„ ์†Œ๊ฐœํ•ฉ๋‹ˆ๋‹ค.

๊ธฐ์กด์˜ Generlization ์„ฑ๋Šฅ์€ Training error - Eest error ๋กœ ๊ณ„์‚ฐ ํ•˜์—ฌ์™”์Šต๋‹ˆ๋‹ค. ํ•™์Šต ๋ฐ์ดํ„ฐ์— ๋Œ€ํ•œ ์„ฑ๋Šฅ๊ณผ ํ…Œ์ŠคํŠธ ๋ฐ์ดํ„ฐ์— ๋Œ€ํ•œ ์„ฑ๋Šฅ์ด ๋น„์Šทํ•˜๋ฉด ๋น„์Šท ํ•  ์ˆ˜๋ก ์ข‹๋‹ค๊ณ  ์—ฌ๊ฒจ ์™”๊ธฐ ๋•Œ๋ฌธ์ž…๋‹ˆ๋‹ค. ๊ทธ๋Ÿฐ๋ฐ ์ด ๊ธฐ์กด์˜ ํ†ต๋…์„ ๊นจ๋ถ€์ˆ˜๋Š” ์—ฐ๊ตฌ ๊ฒฐ๊ณผ๊ฐ€ ๋‚˜์™”๊ณ  ๋”ฅ๋Ÿฌ๋‹์€ ํ•™์Šต์„ ํ•˜๋Š” ๊ฒƒ์ด ์•„๋‹ˆ๋ผ '์™ธ์šฐ๋Š” ๊ฒƒ์ด๋‹ค' ๋ผ๊ณ  ๋…ผ๋ฌธ์˜ ์ €์ž๋“ค์€ ์ฃผ์žฅํ•ฉ๋‹ˆ๋‹ค.

  • Understanding deep learning requires rethinking generalization

CNN์€ ์ด๋ฏธ์ง€ ๋ถ„๋ฅ˜์—์„œ ๋งค์šฐ ํšจ๊ณผ์ ์ธ ๋ชจ๋ธ์ด๋ผ๋Š” ๊ฒƒ์€ ๋ˆ„๊ตฌ๋‚˜ ์•„๋Š” ์‚ฌ์‹ค์ž…๋‹ˆ๋‹ค. Graphical Representation Learning ์œผ๋กœ ์ด๋ฏธ์ง€์˜ ํŠน์ง•์„ ์ž˜ ์žก์•„๋‚ด๊ธฐ ๋•Œ๋ฌธ์ด์ฃ . ๊ทธ๋Ÿฐ๋ฐ, ์ด CNN์ด ์ด๋ฏธ์ง€์˜ Shape์„ ํ•™์Šต ์‹œํ‚ค๋Š” ๊ฒƒ์ด์•„๋‹ˆ๋ผ texture ๋ฅผ ํ•™์Šต์‹œํ‚ค๋Š” ๊ฒƒ์ด๋‹ค ๋ผ๋Š” ์—ฐ๊ตฌ ๊ฒฐ๊ณผ๊ฐ€ ์žˆ์Šต๋‹ˆ๋‹ค. ์ด ๋…ผ๋ฌธ์€  ๋‹จ ํ•œ์ค„์˜ ์ˆ˜์‹๋„ ์—†์ด, ์˜ค์ง ์‹คํ—˜ ๊ฒฐ๊ณผ๋งŒ ๊ฐ€์ง€๊ณ  AI Top Conference์ธ ICLR์— Oral๋กœ Accept๋œ ๋…ผ๋ฌธ์ž…๋‹ˆ๋‹ค. ๋งค์šฐ ๋งค์šฐ ํ•™์ˆ ์  ๊ฐ€์น˜๊ฐ€ ๋†’๋‹ค๋ผ๋Š” ์ด์•ผ๊ธฐ ์ž…๋‹ˆ๋‹ค.

  • ImageNET-Trained CNNS Are Biased Towards Texture

์ธ๊ฐ„๊ณผ ๋”ฅ๋Ÿฌ๋‹์ด Generalization ์— ์žˆ์–ด์„œ ์–ด๋– ํ•œ ์ฐจ์ด์ ์ด ์žˆ๊ณ , ์–ด๋–ป๊ฒŒ ํ•˜๋ฉด ๋”ฅ๋Ÿฌ๋‹์ด ์ธ๊ฐ„๊ณผ ๋น„์Šทํ•˜๊ฒŒ Generalization ํ•  ์ˆ˜ ์žˆ๋Š”์ง€์— ๋Œ€ํ•œ ๋…ผ๋ฌธ์„ ์†Œ๊ฐœํ•ฉ๋‹ˆ๋‹ค.

  •  Generalisation in humans and deep neural networks

์ด๋ฏธ์ง€ ๋ถ„๋ฅ˜์˜ ์„ฑ๋Šฅ์„ ๋†’์ด๊ณ , ์ผ๋ฐ˜ํ™”์— ๋Œ€ํ•œ ์„ฑ๋Šฅ์„ ๋†’์ด๊ธฐ ์œ„ํ•œ ๊ฐ€์žฅ ๊ธฐ๋ณธ์ ์ธ ๋ฐฉ๋ฒ•์ด Data augmentation์ธ๋ฐ, ์ด๋ฅผ ํ™•์žฅํ•˜์—ฌ ์กฐ๊ธˆ ๋” ํšจ๊ณผ์ ์ธ ๋ฐฉ๋ฒ•์œผ๋กœ augmentation ํ•˜๋ฉด Cutout๊ณผ Cutmix๋ฅผ ์†Œ๊ฐœํ•ฉ๋‹ˆ๋‹ค. ๋”๋ถˆ์–ด, ์„ ์ƒ์ด ํ•™์ƒ์—๊ฒŒ ์ง€์‹์„ ์ „๋‹ฌํ•˜๋Š” ๊ฐœ๋…์ธ Knowledge Distillation ์˜ ๊ฐœ๋…์— ๋Œ€ํ•ด์„œ๋„ ์†Œ๊ฐœํ•ฉ๋‹ˆ๋‹ค.

  • Cutout/Cutmix, Knowledge Distillation

'์–ด๋ฆฐ ์†Œ๋…€'์˜ ์ด๋ฏธ์ง€๋ฅผ Girl๋กœ ํ•™์Šตํ•˜๋Š” ๊ฒƒ์ด ๋งž์„ ๊นŒ์š”? ์•„๋‹ˆ๋ฉด Woman์œผ๋กœ ํ•™์Šต ํ•˜๋Š” ๊ฒƒ์ด ๋งž์„๊นŒ์š”?Girl๊ณผ Woman ์ ˆ๋ฐ˜์ •๋„๋กœ ํ•™์Šตํ•˜๋ฉด ๋”ฅ๋Ÿฌ๋‹์˜ Generalization ์— ๋” ์ข‹์€ ํšจ๊ณผ๊ฐ€ ์žˆ์ง€ ์•ˆ์„๊นŒ์š”? ์ด๋Ÿฌํ•œ ๋ฐฉ๋ฒ•์„ Label Softening์ด๋ผ๊ณ  ํ•˜๋ฉฐ, Knowledge Distillation์„ ์ด์šฉํ•˜์—ฌ label softening์„ ์ง„ํ–‰ํ•˜๊ธฐ๋„ ํ•ฉ๋‹ˆ๋‹ค. ์ด ๋ฐฉ๋ฒ•๋“ค์„ ์ด์šฉํ•˜์—ฌ Regularization ํ•˜๋Š” ์—ฐ๊ตฌ๋ฅผ ์†Œ๊ฐœํ•ด ๋“œ๋ฆฝ๋‹ˆ๋‹ค.

  • Regularizing Class-wise Predictions via Self-knowledge Distillation

๐ŸŒˆ  ๊ธฐํƒ€ ์ฝ์–ด๋ณผ๋งŒํ•œ ๋…ผ๋ฌธ ๋ฆฌ๋ทฐ

์ฝ์–ด๋ณผ๋งŒํ•œ ์‰ฝ๊ณ  ์ข‹์€ ๋…ผ๋ฌธ ๋ช‡๊ฐ€์ง€๋ฅผ ๋ฆฌ๋ทฐํ•ด๋“œ๋ฆฝ๋‹ˆ๋‹ค!

๋…ผ๋ฌธ ๋ฆฌ๋ทฐ๋Š” ๊ณ„์†ํ•ด์„œ ์—…๋ฐ์ดํŠธ ๋  ์˜ˆ์ •์ž…๋‹ˆ๋‹ค!

์ฝ”๋ผ๋ฆฌ ์‚ฌ์ง„์— ์•ฝ๊ฐ„์˜ ๋…ธ์ด์ฆˆ๋ฅผ ์ถ”๊ฐ€ํ•˜๋ฉด ์ธ๊ฐ„์˜ ๋ˆˆ์—๋Š” ์ฝ”๋ผ๋ฆฌ๋กœ ๋ณด์ด์ง€๋งŒ, ๋”ฅ๋Ÿฌ๋‹์€ Koala๋กœ ์˜ˆ์ธกํ•ฉ๋‹ˆ๋‹ค. ๋…ธ์ด์ฆˆ๋ฅผ ํ†ตํ•ด ๋”ฅ๋Ÿฌ๋‹์„ ์†์ด๋Š” ๋ถ„์•ผ๊ฐ€ ์ƒ๊ฒจ๋‚˜๋ฉด์„œ ๊ด€๋ จ ์—ฐ๊ตฌ๋“ค์ด ๋งŽ์ด ๋“ฑ์žฅ ํ•˜์˜€๋Š”๋ฐ, ๊ทธ์ค‘ ํ•˜๋‚˜์˜ ๋…ธ์ด์ฆˆ๋งŒ ์ถ”๊ฐ€ํ•˜๋ฉด ๊ฑฐ์˜ ๋ชจ๋“  ์ด๋ฏธ์ง€๋ฅผ ๋”ฅ๋Ÿฌ๋‹์ด ์ž˜ ๋ชป ๋งž์ถ”๊ฒŒ ํ• ์ˆ˜ ์žˆ๋‹ค๋ผ๋Š” ์—ฐ๊ตฌ๊ฐ€ ์žˆ์–ด ์†Œ๊ฐœํ•ฉ๋‹ˆ๋‹ค.

  • Universal Perturbation 

๋”ฅ๋Ÿฌ๋‹์˜ ๋ชจ๋ธ ๊ตฌ์กฐ๋Š” ๊ฐ„๋‹จํ•œ ๋ฌธ์ œ์—๋Š” ๋‹จ์ˆœํ•œ ๋ชจ๋ธ ๋ณต์žกํ•œ ๋ฌธ์ œ์—๋Š” ๋ณต์žกํ•œ ๋ชจ๋ธ์„ ๊ฐ€์ ธ๊ฐ€์•ผ ํ•œ๋‹ค๊ณ  ์•Œ๋ ค์ ธ ์žˆ์Šต๋‹ˆ๋‹ค. ์ด์™€ ๊ด€๋ จํ•ด์„œ ๋”ฅ๋Ÿฌ๋‹์˜ ๋ชจ๋ธ ํฌ๊ธฐ์™€ ํ•™์Šต epoch์ˆ˜ ๊ทธ๋ฆฌ๊ณ  overfitting์˜ ๊ด€๊ณ„์— ๋Œ€ํ•ด์„œ ์—ฐ๊ตฌํ•œ ๋…ผ๋ฌธ์ด ์žˆ์Šต๋‹ˆ๋‹ค.

  • Deep Double Descent 

์•„๋ž˜ ๊ทธ๋ฆผ์—์„œ ๋„ค๊ฐœ์˜ ๊ทธ๋ฆผ์€ ๋ชจ๋‘ '๊ฐ•์•„์ง€'๋ผ๋Š” ๊ฒƒ์„ ์•Œ ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค. ํ•˜์ง€๋งŒ, ๋ชจ๋‘ ๋‹ค๋ฅธ style์„ ์ง€๋‹ˆ๊ณ  ์žˆ์ฃ . CNN์€ ํ•œ ๋„๋ฉ”์ธ์˜ ๊ฐ•์•„์ง€๋ฅผ ํ•™์Šต์‹œํ‚ค๋ฉด ๋‹ค๋ฅธ ๋„๋ฉ”์ธ์˜ ๊ฐ•์•„์ง€๋ฅผ ๋งž์ถ”์ง€ ๋ชปํ•ฉ๋‹ˆ๋‹ค. ํ•™์Šต ๋ฐ์ดํ„ฐ์™€ ํ…Œ์ŠคํŠธ ๋ฐ์ดํ„ฐ๊ฐ€ ๊ฐ™์€ ๋ถ„ํฌ์— ์žˆ๋‹ค๋Š” ๊ฐ€์ •์ด ์žˆ๊ธฐ ๋•Œ๋ฌธ์ด์ฃ . ์—ฌ๋Ÿฌ ๋„๋ฉ”์ธ์— ๋Œ€ํ•˜์—ฌ Generalization ํ•˜๋Š” ๊ฒƒ์„ Domain Generalization ์ด๋ผ๊ณ  ํ•˜๋ฉฐ, ์ด์— ๋Œ€ํ•œ ์—ฐ๊ตฌ๋ฅผ ์†Œ๊ฐœ ํ•ฉ๋‹ˆ๋‹ค. 

  • Domain Generalization With MixStyle 

๐Ÿ™‹๐Ÿปโ€โ™‚๏ธ ๊ฐ•์˜ ๊ด€๋ จ ์˜ˆ์ƒ ์งˆ๋ฌธ

Q. ์ˆ˜ํ•™์ ์ธ ์ง€์‹์ด ๋งŽ์ด ํ•„์š”ํ•œ๊ฐ€์š”?
A. MLP๋ถ€๋ถ„์—์„œ ์กฐ๊ธˆ ํ•„์š”ํ•˜๊ธด ํ•ฉ๋‹ˆ๋‹ค๋งŒ, ์—†์œผ์…”๋„ ์ „์ฒด์ ์ธ ๊ฐ•์˜๋ฅผ ๋“ค์œผ์‹œ๋Š” ๋ฐ์—๋Š” ์ง€์žฅ์ด ์—†์Šต๋‹ˆ๋‹ค.

Q. python์„ ๋‹ค๋ฃฐ์ค„ ์•Œ์•„์•ผ ํ•˜๋‚˜์š”?
A. ๋„ค, python์„ ์–ด๋Š์ •๋„ ํ•  ์ค„ ์•ˆ๋‹ค๋Š” ์ „์ œํ•˜์— ์ˆ˜์—…์„ ์ง„ํ–‰ํ•ฉ๋‹ˆ๋‹ค. ๋‹ค๋งŒ ๋”ฅ๋Ÿฌ๋‹์„ ์œ„ํ•œ PyTorch ํ…Œํฌ๋‹‰๋„ ํ•œ์‹œ๊ฐ„ ๊ฐ€๋Ÿ‰ ๋‹ค๋ฃจ๊ณ  ์žˆ์Šต๋‹ˆ๋‹ค.

Q. ์–ด๋–ค ๋…ผ๋ฌธ์„ ๋ฆฌ๋ทฐํ•˜๋‚˜์š”?
A. ๋”ฅ๋Ÿฌ๋‹์— ๊ด€ํ•˜์—ฌ ์ฝ๊ธฐ ์‰ฝ๊ณ , ๊ธฐ์—ฌ๋„๊ฐ€ ๋งค์šฐ ๋†’์€ ๋…ผ๋ฌธ์„ ์ฃผ๋กœ ๋ฆฌ๋ทฐ ํ•ฉ๋‹ˆ๋‹ค. ์ƒˆ๋กœ์šด ์ข‹์€ ๋…ผ๋ฌธ์„ ๋ฐœ๊ฒฌํ•  ๋•Œ ๋งˆ๋‹ค ๋…ผ๋ฌธ ๋ฆฌ๋ทฐ ์˜์ƒ์„ ์ถ”๊ฐ€ํ•  ์˜ˆ์ •์ž…๋‹ˆ๋‹ค.

์‹ค์Šต ์ง€์‹ ๊ณต์œ ์ž ์†Œ๊ฐœ

๐Ÿ™†๐Ÿปโ€โ™€ Justin

 - ์—ฐ์„ธ๋Œ€ ์‚ฐ์—…๊ณตํ•™๊ณผ ์„์‚ฌ๊ณผ์ •

 - DataScience/๋”ฅ๋Ÿฌ๋‹ ์—ฐ๊ตฌ 

 - https://github.com/Justin-A

์ด๋Ÿฐ ๋ถ„๋“ค๊ป˜
์ถ”์ฒœ๋“œ๋ ค์š”!

ํ•™์Šต ๋Œ€์ƒ์€
๋ˆ„๊ตฌ์ผ๊นŒ์š”?

  • ๋”ฅ๋Ÿฌ๋‹ ๋ฐฐ์šฐ๊ณ  ์‹ถ์œผ์‹  ๋ถ„

  • NeuralNetwork๊ธฐ์ดˆ๋ถ€ํ„ฐ ํ™•์‹คํžˆ ๋ฐฐ์šฐ๊ณ  ์‹ถ์œผ์‹  ๋ถ„

  • ๋”ฅ๋Ÿฌ๋‹์˜ ๊ธฐ๋ณธ ์ด๋ก  ๋ถ€ํ„ฐ ๋ฐœ์ „๋˜๋Š” ๋ถ„์•ผ๊นŒ์ง€ ์•Œ๊ณ  ์‹ถ์œผ์‹  ๋ถ„

์„ ์ˆ˜ ์ง€์‹,
ํ•„์š”ํ• ๊นŒ์š”?

  • python์— ๋Œ€ํ•œ ๊ธฐ๋ณธ ์ง€์‹

  • machine learning์— ๋Œ€ํ•œ ๊ธฐ๋ณธ ์ง€์‹

์•ˆ๋…•ํ•˜์„ธ์š”
์ฝ”์ฝ”์ž…๋‹ˆ๋‹ค.

8,137

๋ช…

์ˆ˜๊ฐ•์ƒ

489

๊ฐœ

์ˆ˜๊ฐ•ํ‰

136

๊ฐœ

๋‹ต๋ณ€

4.4

์ 

๊ฐ•์˜ ํ‰์ 

20

๊ฐœ

๊ฐ•์˜

ํ•™๋ถ€์—์„œ๋Š” ํ†ต๊ณ„ํ•™์„ ์ „๊ณตํ•˜๊ณ  ์‚ฐ์—…๊ณตํ•™(์ธ๊ณต์ง€๋Šฅ) ๋ฐ•์‚ฌ๋ฅผ ๋ฐ›๊ณ  ์—ฌ์ „ํžˆ ๊ณต๋ถ€์ค‘์ธ ๋ฐฑ์ˆ˜์ž…๋‹ˆ๋‹ค.

 

์ˆ˜์ƒ

ใ† ์ œ6ํšŒ ๋น…์ฝ˜ํ…Œ์ŠคํŠธ ๊ฒŒ์ž„์œ ์ €์ดํƒˆ ์•Œ๊ณ ๋ฆฌ์ฆ˜ ๊ฐœ๋ฐœ / ์—”์”จ์†Œํ”„ํŠธ์ƒ(2018)

ใ† ์ œ5ํšŒ ๋น…์ฝ˜ํ…Œ์ŠคํŠธ ๋Œ€์ถœ ์—ฐ์ฒด์ž ์˜ˆ์ธก ์•Œ๊ณ ๋ฆฌ์ฆ˜๊ฐœ๋ฐœ / ํ•œ๊ตญ์ •๋ณดํ†ต์‹ ์ง„ํฅํ˜‘ํšŒ์žฅ์ƒ(2017)

ใ† 2016 ๋‚ ์”จ ๋น…๋ฐ์ดํ„ฐ ์ฝ˜ํ…Œ์ŠคํŠธ/ ๊ธฐ์ƒ์‚ฐ์—… ์ง„ํฅ์›์žฅ์ƒ(2016) 

ใ† ์ œ4ํšŒ ๋น…์ฝ˜ํ…Œ์ŠคํŠธ ๋ณดํ—˜์‚ฌ๊ธฐ ์˜ˆ์ธก ์•Œ๊ณ ๋ฆฌ์ฆ˜ ๊ฐœ๋ฐœ / ๋ณธ์„ ์ง„์ถœ(2016)

ใ† ์ œ3ํšŒ ๋น…์ฝ˜ํ…Œ์ŠคํŠธ ์•ผ๊ตฌ ๊ฒฝ๊ธฐ ์˜ˆ์ธก ์•Œ๊ณ ๋ฆฌ์ฆ˜ ๊ฐœ๋ฐœ / ๋ฏธ๋ž˜์ฐฝ์กฐ๊ณผํ•™๋ถ€ ์žฅ๊ด€์ƒ(2015)

* blog : https://bluediary8.tistory.com

์ฃผ๋กœ ์—ฐ๊ตฌํ•˜๋Š” ๋ถ„์•ผ๋Š” ๋ฐ์ดํ„ฐ ์‚ฌ์ด์–ธ์Šค, ๊ฐ•ํ™”ํ•™์Šต, ๋”ฅ๋Ÿฌ๋‹ ์ž…๋‹ˆ๋‹ค.

ํฌ๋กค๋ง๊ณผ ํ…์ŠคํŠธ๋งˆ์ด๋‹์€ ํ˜„์žฌ๋Š” ์ทจ๋ฏธ๋กœ ํ•˜๊ณ ์žˆ์Šต๋‹ˆ๋‹ค :) 

ํฌ๋กค๋ง์„ ์ด์šฉํ•ด์„œ ์ธ๊ธฐ์žˆ๋Š” ์ปค๋ฎค๋‹ˆํ‹ฐ ๊ธ€๋งŒ ์ˆ˜์ง‘ํ•ด์„œ ๋ณด์—ฌ์ฃผ๋Š” ๋งˆ๋กฑ์ด๋ผ๋Š” ์•ฑ์„ ๊ฐœ๋ฐœํ•˜์˜€๊ณ 

์ „๊ตญ์˜ ๋ง›์ง‘๋ฆฌ์ŠคํŠธ์™€ ๋ธ”๋กœ๊ทธ๋ฅผ ์ˆ˜์ง‘ํ•ด์„œ ๋ง›์ง‘ ์ถ”์ฒœ ์•ฑ๋„ ๋งŒ๋“ค์—ˆ์—ˆ์ฃ  :) (์‹œ์›ํ•˜๊ฒŒ ๋ง์•„๋จน..)

์ง€๊ธˆ์€ ์ธ๊ณต์ง€๋Šฅ์„ ์—ฐ๊ตฌํ•˜๋Š” ๋ฐ•์‚ฌ๊ณผ์ •์ƒ์ž…๋‹ˆ๋‹ค.

 

 

 

 

๋”๋ณด๊ธฐ

์ปค๋ฆฌํ˜๋Ÿผ

์ „์ฒด

43๊ฐœ โˆ™ (11์‹œ๊ฐ„ 41๋ถ„)

ํ•ด๋‹น ๊ฐ•์˜์—์„œ ์ œ๊ณต:

์ˆ˜์—…์ž๋ฃŒ
๊ฐ•์˜ ๊ฒŒ์‹œ์ผ: 
๋งˆ์ง€๋ง‰ ์—…๋ฐ์ดํŠธ์ผ: 

์ˆ˜๊ฐ•ํ‰

์•„์ง ์ถฉ๋ถ„ํ•œ ํ‰๊ฐ€๋ฅผ ๋ฐ›์ง€ ๋ชปํ•œ ๊ฐ•์˜์ž…๋‹ˆ๋‹ค.
๋ชจ๋‘์—๊ฒŒ ๋„์›€์ด ๋˜๋Š” ์ˆ˜๊ฐ•ํ‰์˜ ์ฃผ์ธ๊ณต์ด ๋˜์–ด์ฃผ์„ธ์š”!