succulentum 님의 블로그

[논문리뷰]Training language models to follow instructionswith human feedback

2022.03.04. openAI. LLM + RLHF의 아이디어인가보다. 0. Abstract- LLM의 크기를 늘여도 사람의 의도를 이해하는데 한계를 보인다. 거짓말, 해로운 말 등을 한다. (not aligned with user)- Human Feedback으로 유저와 align하게끔 finetuning 하는 법을 제시한다. 1. OpenAI API로 우리가 기대하는 모델 반응과 레이블을 작성 2. GPT-3 fine tune 3. 결과(들)을 ranking, human feedback으로 더욱 fine tune 4. Instruct GPT 완성.- 1.3B Instruct GPT > 175B GPT-3, 진실성 증가, 해로움 감소, 공개 NLP 데이터셋에서도 좋은 성능-..

카테고리 없음 2024.08.12

[논문리뷰] TinyLLaVA Factory: A Modularized Codebase forSmall-scale Large Multimodal Models

날씨가 참 덥다. 오늘도 열심히 공부하고 열심히 살아야지. 2024.05.20 논문이다. 상당히 최신 논문이다. 내가 참여한 프로젝트에 쓰이기 때문에 읽는다. 0. Abstracttinyllava는 modular, small scale LMM, open source 1. Introduction- factory pattern(= modularized)- comes with multiple versions2. Architecture and Key Components- 5개의 모듈로 이루어져 있다. (data, model, training recipie, trainer, evaluator)- 이들의 의존성을 최소화하려 했다.- 소규모를 위해 제작되었지만 단순히 스케일을 키우는 것 만으로도 대규모의 LMM을 ..

카테고리 없음 2024.08.04

[논문리뷰] OpenECAD: An Efficient Visual Language Model for Computer-Aided Design

이번에도 CAD 관련 논문이다. 3D를 input으로 받고, language model을 이용해서 2D sketch, 3D construction command를 작성한다고 한다. Q: 어떤 Dataset을 썼을까?Q: 어떤 방법으로 language model을 이용했을까? 1. introduction- 우리는 sketch & extrusion을 사용했다. 그것이 인간의 직관과 더 가깝다. - 여태까지의 NN을 사용한 모델들은 input에 한계가 있었다.(point cloud를 쓴다거나, isometric hand drawn sketch를 요구한다거나...)- 우리는 language model로 이를 극복하고자 한다. 1. Dataset: Sketchgraphs, Fusion360, DeepCAD..

카테고리 없음 2024.07.30

[논문리뷰]Learning Transferable Visual Models From Natural Language Supervision

논문 링크: https://arxiv.org/abs/2103.00020 코드 링크: https://github.com/OpenAI/CLIP CLIP이라는 모델이 소개된 유명한 논문이다. 논문 페이지가 꽤 길었다(48p). 수학적인 부분은 생각보다 적었다. 0. abstract-기존 컴퓨터 비전 모델들은 category가 한정되어있었지만, clip 모델은 text와 image pair를 같이 학습함으로써 주어진 이미지가 어떤 text와 제일 유사한지 측정할 수 있다. zero shot 에서 resnet-50와 맞먹는 accuracy를 가진다. 1. introduction and motivating work- NLP는 task-agnostic한 모델이 많다. 특정한 dataset없이 상용 가능하다.- 그러..

카테고리 없음 2024.07.20

CAD format/dataset

CAD(Computer Aided Design)은 도면, 3D 프린팅 등에 쓰이는 소프트웨어다. CAD 파일의 확장에는 어떤 것들이 있을까?엄청나게 많은 확장자를 지원하지만 중요하다고 생각되는 몇가지를 살펴보자. 1. .STL( STereoLithography)3차원 mesh 형태의 확장자다. 삼각형으로 3D를 표현한다. https://en.wikipedia.org/wiki/STL_(file_format) STL (file format) - WikipediaFrom Wikipedia, the free encyclopedia Standard Tessellation Language. File format for 3D printing and scanning applications. STL is a file ..

카테고리 없음 2024.07.12

SCIE

SCIE (Science Citation Index Expanded, 과학인용색인 확장판)은 글로벌 학술 저널 데이터베이스다.예전에는 SCI가 따로 있었는데 이제는 SCIE로 통합되었다. 아무 저널이나 등록되는게 아니라 일정수준 이상의 저널만 등재된다. SCIE에 등록된 저널은 수준높은 저널이라고 할 수 있다.SCIE급 저널/논문 이라는 표현도 쉽게 찾아볼 수 있다. 유사한 데이터베이스로는 SSCI (Social Sciences Citation Index, 사회과학 논문 인용색인)A&HCI (Arts and Humanities Citation Index, 예술 및 인문과학 논문 인용색인)글로벌 학술 저널 DB이므로 영어로 된 저널만 받는다. journal(학술지)는 일정 주제의 논문을 정기적으로 발행..

카테고리 없음 2024.07.08

JCR(Journal Citation Reports)알아보기

journal(학술지)는 특정 주제의 논문을 정기적으로 발행하는 곳이다. Journal을 읽어보자. 무슨 저널을 읽어볼까? 저널을 어떻게 평가할까? JCR: https://jcr.clarivate.com/jcr/home Journal Citation Reports jcr.clarivate.comJournal Citation Report 이곳에서 journal을 검색하고 journal의 quality를 짐작할 수 있다."IEEE Access"를 검색해본다. 몇가지 눈여겨볼만한 점을 기록하겠다. journal impact factor인데, 25%마다 Q1-Q4로 나누었다.여기서는 65.3%로 Q2임을 알 수 있다. 보통 Q1 Q2를 쳐준다.eigenfactor score 등 많은 통계적인 수치들을 확인할 ..

카테고리 없음 2024.07.08

Queries of TODO

https://distill.pub/2018/feature-wise-transformations/ Feature-wise transformationsA simple and surprisingly effective family of conditioning mechanisms.distill.pub: comparison of LLMs

카테고리 없음 2024.07.03

일	월	화	수	목	금	토
				1	2	3
4	5	6	7	8	9	10
11	12	13	14	15	16	17
18	19	20	21	22	23	24
25	26	27	28	29	30	31

succulentum 님의 블로그

전체 글 8

티스토리툴바