from Karte,

[NVIDIA GTC Online 2020 Fall] Webinar Notes 본문

ways of seeing/conference visits

[NVIDIA GTC Online 2020 Fall] Webinar Notes

karte 2020. 10. 9. 22:41

* 혹시 문제되는 내용이 있다면 댓글로 알려주세요. 수정하겠습니다.

* NVIDIA 에서 주최한 GTC 2020 행사에서 시청한 웨비나 자료를 바탕으로 작성한 글입니다. 영상에 대한 내용보다는 해당 웨비나 시청 이유와 감상평이 주를 이룰 예정이니 참고 바랍니다. 

* 메모 중 '키포인트' 항목은 발표 내용을 그대로 쓰지 않고 제가 추후 알아 본 정보와 요약을 하여 작성한 것으로 실제 내용과는 차이가 있을 수 있습니다. 따라서 이 블로그 내에서만 읽어주시고 (그럴 일은 없을 것 같지만) 외부로 내용을 옮기는 행위는 자제해 주시면 감사하겠습니다. 

 

 

NVIDIA GTC 2020 의 마지막 날! 그동안 시청한 웨비나 영상들 중 몇 개를 골라 기록을 하려고 한다. 나는 학생 할인을 받아 무료로 참가했지만, 기본적으로 본 행사는 유로이기에 영상의 일부를 캡처해서 올린다거나 자막을 그대로 받아적어 올리는 것은 매우 실례가 되기도 하고 윤리적으로 옳지 못하다고 생각하여 메모 형식의 짤막한 글을 쓰려고 한다. ( 행사 홈페이지에 로그인하지 않아도 제목과 영상 소개는 확인 가능하니 이 정도는 괜찮지 않을까 생각한다. )  그러니 혹시라도 이 포스팅을 읽는 분들은 여기에 적힌 내용이 전부라고 여기지 않으셨으면 좋겠다. 그냥 '다뤄진 주제들 중 일부는 이렇구나' 정도면 보시면 좋지 않을까 싶다. 

 

 


현대화된 AI 데이터 파이프라인 디자인부터 구축 방법, 사례까지 한 눈에 알아보기! ( Presented by Pure Storage) [A22471]

 

  • 시청 이유 : 실무에서 AI 프로젝트를 진행할 때 데이터 수집 단계부터 모델 학습 단계까지 데이터가 흘러가는지에 대한 하나의 실례를 알아보기 위함
  • 키포인트 : '데이터 허브' - 데이터 중심의 스토리지 아키텍처로, 분리된 스토리지에 각각 데이터가 존재할 경우보다 데이터 흐름이 용이하고 관리가 쉬워 작업 효율성 증가에 도움 ( 해당 발표에서 용어 발췌 )
  • 감상 : 데이터 품질이 아무리 좋아도, 최고 성능을 내는 알고리즘을 개발했어도 결국 하드웨어가 있어야 소용이 있다는 발표자 ( 퓨어스토리지 이규현 상무님 ) 분의 말씀에 정말 공감하면서 보았다. 이번에 참가한 빅콘테스트에서 시험적으로 모델을 학습시킬 때 시간이 너무 많이 걸려서 답답했던 적이 있기 때문이다. 전체적으로 해당 회사의 제품을 홍보 및 시연에 초점이 맞춰진 것 같았지만 행사의 목적을 생각해 보면 당연한 것 같다. 발표 덕분에 현업에서의 데이터 파이프라인이라는 개념에 대해 다시 한번 떠올려 볼 수 있었다. 
  • 새로 알아 볼 / 보충할 개념 : IO Bound ( 데이터 수집 시 ), 도커

 

 

Deep Learning at Scale for Personalization Use Cases in E-Commerce and Media Streaming [A21641]

 

  • 시청 이유 : E-Commerce 에 대한 관심 (으로 영상을 클릭했는데 이제 보니 참석자 수준이 비즈니스/임원으로 설정되어 있다...)
  • 키포인트 : Gravity R&D 에서 개발한 Session - based Recommendation 알고리즘 (논문은 여기)behavior data / Theano / session length is not fixed → session parallel processing / pred. next item
  • 감상 : 이미 발표된 추천 시스템 분야의 논문 Session-based Recommendation with Recurrent Neural Networks 의 저자 2명이 본인들의 알고리즘에 대해 개괄적으로 설명하고 어떻게 inference pipeline 을 구성했는지 설명하는데...보면서 많은 것을 느꼈다. 일단 '수학적 개념을 풀고자 하는 문제에 맞게 응용하는 역량 혹은 실무에 적용하는 능력' 이 무엇을 말하는 것인지 확실히 이해하게 되었다. 또 해당 알고리즘의 도전 과제까지 짚어줌으로써 비즈니스적인 측면까지 ( productization ) 고려해야 한다는 메시지를 던진 점도 인상 깊었다. 
  • 새로 알아 볼 / 보충할 개념 : EU GDPR ( 데이터 보호 관련 가이드라인 ), softmax, bayesian stats

 

 

AI Art : A New Movement Powered by NVIDIA GPUs [A21921]

 

  • 시청 이유 : ART 에 관한 발표다. 무슨 이유가 더 필요할까!
  • 키포인트 : "2010년대 발표되기 시작한 딥러닝 알고리즘들을 2015년부터 자신의 작품을 제작하기 위해 활용하는 예술가들이 많아졌고 이렇게 새로운 예술이 탄생했다." ( 연사 발표 인용 ) / 모델 훈련 도식의 간략화와 매끄러운 설명
  • 감상 : 3분 정도의 짧은 발표였지만 내가 미술을 좋아하는 이유를 다시금 느끼게 해준 내용이었다. 
  • 첨부 링크 : 연사 3명의 홈페이지 링크   
  • 새로 알아 볼 / 보충할 개념 : NVIDIA CUDA 간단 정리

 

 

Accelerating Rare Disease Treatments with AI [A21461]

 

  • 시청 이유 : 예전부터 갖고 있던 스타트업에 대한 관심, 희귀병은 말 그대로 희귀한 병이라 데이터가 부족할 것 같은데 그 문제를 어떻게 해결하는지에 대한 궁금증
  • 키포인트 : 흩어져 있는 약리학적 지식과 각종 연구 결과를 모아 신약을 개발하기 위한 데이터로 쓰기 ( 도식은 공개 불가 )
  • 감상 : 역시 스타트업 세션에 있는 5분 미만의 짧은 발표라 그런가 깊이 있는 이야기 보단 스타트업이 해결하려는 문제와 그 문제를 해결하기 위해 머신러닝과 딥러닝을 어떻게 사용하고 있는지 대략적으로 설명하고 끝이 나서 아쉽기도 했다. 아...방금 오히려 제약과 의료라는, 도메인 지식의 장벽이 높은 분야의 주제를 다루고 있어 일부러 최대한 쉽게 설명한 연사 분의 배려인가 하는 생각도 들었다...의료 인공지능은 언제봐도 흥미롭지만 또 한편으로는 해당 분야 지식이 없어 항상 표면만을 훑게 되는 부분이 아쉽다.
  • 새로 알아 볼 / 보충할 개념 : knowledge graph, embedding

그 외 키노트나 다른 영상들은 굳이 기록으로 남기지 않고 관련 내용을 학습한 후 따로 ML 이나 DL 카테고리에 남길 생각이다. 이상!

Comments