1. 시작 계기 학교 공대전공공통 과목 수업 중, 다학제협업설계라는 수업을 수강하게 되었다. 강의계획서를 보니, 3개월의 학기 동안, 첫-둘째 수업은 주제를 선정하여 팀을 배정하고, 이후 1개월간 아두이노 교육, 기계 활용 교육 등의 교육을 시행한 뒤 (선택사항), 남은 1~2개월 동안 작은 프로젝트를 만드는 수업이었다. 친한 컴퓨터공학과 친구들과 이 수업을 수강하면서 작은 웹 서비스 프로젝트를 만들어보면 재밌을 것 같다고 생각했다. 2. 주제 선정 및 IA 당시 computer vision 분야의 논문들을 많이 읽고, 해당 분야에 관심이 많았던 나는, 특정 한 분야의 사람들을 학습해서 닮은꼴을 찾아주는 닮은꼴 웹사이트를 만들어보고 싶었다. (이미 몇 서비스들이 출시된 상태였지만, 직접 모델을 학습시키고..
이번에 벨로그에서 티스토리로 블로그를 옮기면서 이전에 작성했던 프로젝트 관련 블로그를 옮겨 적어본다. 신촌 연합 동아리 CEOS의 프론트엔드 스터디 마지막 과제로 next js를 활용한 넷플릭스 클론 코딩 프로젝트를 진행했다. 해당 프로젝트에서는 메인 페이지, searchPage만 구현했다. 배포링크: https://next-netflix-16th-pre-folio-front.vercel.app/ GITHUB: https://github.com/Pre-folio/next-netflix-16th I. 폴더 구조 폴더 구조는 다음과 같다. src |-api |-components |-elements (공유 컴포넌트) |-homePage |-landingPage |-searchPage |-icons |-pag..
AbstractNatural language에는 unlabeled text의 데이터 수가 labeled text의 데이터 수보다 훨씬 많다. 해당 사실에 근거하여 OpenAI에서는 다양한 unlabeled text를 활용하여 모델을 generative 하게 pre-train 시킨 GPT 모델을 제시했다. 해당 모델은 이전 모델들보다 훨씬 뛰어난 성능을 보여 그 결과를 증명했다.Introductionunlabeled data로부터 word-level 이상의 정보를 끌어내는 것은 다음과 같은 두 가지의 이유로 어렵다:transfer에 유용한 text 표현을 배우는 것에 어떤한 형태의 최적화 목적 (optimation objectives)가 좋은지 모른다.학습된 표현을 target task에 전달할 가장 좋은..
지난번에 배운 BoW, DTM, TF-IDF, 유클리디안 유사도, 코사인 유사도를 활용하여 직접 크롤링한 '스타벅스' 관련 기사 데이터셋으로 문서 유사도를 구하는 실습을 진행해 보았다. 자세한 코드들은 깃허브를 참고하길 바란다. 1. 데이터 확인 및 전처리 데이터를 df라는 변수에 저장하고 확인해 보았다. df.head() 제목 언론사 날짜 URL 네이버뉴스_URL 오늘(1/1) 코스트코 정상영업, 지점별 1월 휴무일·영업시간 '확인하세요' 핀포인트뉴스 2023.01.01. http://www.pinpointnews.co.kr/news/articleView... NaN 호랑이 가고 검은 토끼 온다…유통가 ‘토끼 마케팅’ 활발 인더뉴스 2023.01.01. https://www.inthenews.co.kr..