티스토리챌린지14 [후기] 북촌 스웨덴 레스토랑 만가타 후기 혹시 북촌 근처에서 특별한 날 갈만한 분위기 좋은 식당을 찾고 계시다면 만가타 강추 드려요!식당 자체도 작은 한옥이라 아늑한 분위기고,코스 요리를 주문하면 쉐프 분께서 식사 속도에 맞춰서 다음 음식 계속 내주시고메뉴도 친절하게 설명해 주십니다 😊스웨덴 음식이긴하지만, 한국인 입맛에 맞게 개량해주신 것 같아요! 2024. 11. 20. [논문 리뷰] RS-DPO(Rejection Sampling DPO) 최근에 RLHF, DPO 같은 모델을 학습하는 방법론에 대해 공부해보는 중인데요,오늘은 올해 초 아마존에서 제안한 RS-DPO(Rejection Sampling Direct Preference Optimization)에 대해 소개해드리려고 합니다. RLHF와 DPO 관련 내용이 궁금하시다면 해당 포스팅 1(RLHF), 2(DPO)를 참고 해보시면 좋을 것 같습니다! RS-DPO란?RLHF와 DPO 둘 모두 사람의 선호도를 기반으로 언어 모델을 튜닝해서 조금 더 "사람처럼 답변하는" 또는 "사람이 선호하는 답변을 생성하는" Alignment 과정을 위한 학습방법론입니다.RLHF는 데이터 수집 및 학습에 비용이 많이 들고, 강화학습 방법론의 일종이다 보니 학습이 불안정 할 수 있다는 단점이 있었습니다.이 한.. 2024. 11. 19. DPO란? - RLHF를 개선한 모델 학습 방법론 DPO란?오늘은 지난번에 알아본 RLHF(Reinforcement Learning with Human Feedback)의 효율화된 버전인 DPO(Direct Preference Optimization)에 대해 알아보겠습니다.RLHF와 그 한계점에 알고싶으신 분들은 해당 포스팅을 참고해보시면 좋을 것 같습니다!DPO는 RLHF와 마찬가지로 사람의 피드백을 활용하여 언어 모델을 개선하는 방법론입니다.다만 RLHF의 비용적 한계를 개선하기 위해 좀 더 간단한 접근법을 제시합니다. DPO는 아래와 측면에서 비용적 한계를 개선했습니다.직접적인 선호도 최적화: 사용자의 선호도 데이터를 직접 활용하여 언어 모델을 최적화합니다.리워드 모델 불필요: RLHF와 달리 별도의 리워드 모델을 학습할 필요가 없습니다.간소화된 .. 2024. 11. 18. [후기] 홍대 베리트 네일 후기 맨날 이달의 아트보고 마음에 드는 샵을 전전하다가 최근에 네일샵 정착을 했습니다!!아트도 너무 예쁘고 진짜 꼼꼼하게 시술해주세요.다른 샵에서도 치크네일이랑 자석젤 그라네일 많이 받아봤는데,경계 자연스럽게 풀어주시는게 진짜 대박이에요🥹당연히 내돈내산으로 다니고 있고 앞으로도 계속 다닐 것 같아요!홍대 네일샵 찾고 계시다면 강추합니다😊[네이버 지도]베리트네일서울 마포구 동교로25길 23 401호(동교동, 정암빌딩)https://naver.me/GQ1fyD82 네이버 지도베리트네일map.naver.com 2024. 11. 17. RLHF란? - ChatGPT가 사용한 언어모델 학습 방법론 RLHF란?RLHF(Reinforcement Learning with Human Feedback)는 강화 학습의 한 종류로,사람의 피드백을 활용해서 모델을 개선하는 방법론입니다.강화 학습에서는 주어진 환경에서 얻을 수 있는 보상을 최대화하는 방향으로 학습을 하는데,RLHF는 이 보상이 사람의 선호도라고 생각하면 이해하기 쉽습니다 :) 1+2는 뭐야? 라고 물어봤을 때 아래 답변들 모두 올바른 답변을 했다고 평가할 수 있습니다.정답은 3입니다. 너무 쉬운 문제네요.3입니다.1과 2를 더하면 3이기 때문에 정답은 3입니다.이러한 상황에서는 뭘 기준으로 더 학습을 진행해야 모델이 개선될지 정하기 어려울 수 있는데요,이럴 때 RLHF로 사람의 선호도를 반영하도록 학습을 한다면, 언어 모델은 더 자연스럽고 일관성.. 2024. 11. 16. [SQLP 자격증] 1과목 이론 정리 - 데이터 모델링의 이해, 엔티티, 속성 오늘은 SQLP의 1과목 - 데이터 모델링의 이해에 포함되는 내용 중에서도데이터 모델의 이해, 엔티티, 속성, 식별자에 대해 정리해보겠습니다. 데이터 모델의 이해데이터 모델: 일정한 표기법에 따라 표현한 모형데이터 모델링: 모델을 만들어 가는 일 자체 데이터 모델링의 특징데이터 모델링은 아래 세 가지 특징을 가지고 있습니다.추상화: 현실 세계를 일정한 형식에 맞춰 표현단순화: 약속된 규약을 따라 간결하게 표현명확화: 애매모호함을 제거하고 정확하게 기술 데이터 모델링의 3단계하위로 갈수록 데이터베이스는 점점 구체화 됩니다.개념적 데이터 모델링가장 업무 중심적이고 포괄적, 추상적인 단계입니다.핵심 엔티티와 그들 간의 관계를 발견하고 표현하기 위해 ERD(Entity Relationship Diagram)를 .. 2024. 11. 15. [SQLP 자격증] 시험 범위 및 합격 조건 잡설대학원에 다닐 때 까지는 그래도 열심히 공부를 했던 것 같은데,,,회사에 다니다 보니 점점 자기개발 의지를 잃어가는 것 같아서 2025년은 자격증 취득을 목표로 열심히 살아보려고해요!!순전히 취미로 SQLP, ADP, 정처기, 빅분기 같은 자격증을 따보려고 하는데 일단 현업에 제일 도움이 될 것 같은 SQLP부터 공부해보려고 합니다!이번 포스팅에서는 SQLP 응시 자격과, 뭘 공부해야하는지 알아보도록 할게요😊 SQLP 자격증은?SQLP 자격증은 데이터베이스 및 SQL 전문가로서의 자격을 검증하는 자격증입니다.SQLP는 SQLD보다 고급 과정으로, 데이터베이스 관리, SQL 고급 활용 및 튜닝 능력까지 검증하는 시험이에요.SQLP는 총 3과목으로 이루어져 있는데 그 중에 두 과목이 SQLD와 동일합.. 2024. 11. 14. [Python] re 모듈로 문자열 처리하기 Python에서 re 모듈은 문자열을 처리할 때 특정 패턴을 가진 문자열을 검색하고, 변형하는 데 매우 유용합니다. 정규 표현식은 복잡해 보일 수 있지만, 한 번 익혀두면 매우 유용하게 쓸 수 있습니다. 이번 포스팅에서는 re 모듈의 대표적 함수 사용법을 예제와 함께 알아보겠습니다! re 모듈 시작하기Python에서 아래와 같이 re 모듈을 불러오면 사용할 준비는 끝입니다ㅎ import re re 모듈의 주요 함수re.match(): 문자열의 시작에서 패턴 찾기match 함수는 문자열의 첫 부분이 지정한 패턴과 일치하는지 확인합니다. 일치하면 Match 객체를 반환하고, 그렇지 않으면 None을 반환합니다.import retext = "Hello, world!"pattern = r"Hello"match .. 2024. 11. 13. 워렌버핏의 투자원칙 워렌 버핏은 오마하 출신이라 '오마하의 현인'으로도 불립니다!가장 유명한 명언으로는 "잠자는 동안에도 돈이 들어오는 방법을 찾지 못한다면 당신은 죽을 때까지 일을 해야만 할 것이다" 라는 말이 있죠 :)오늘은 현재까지도 많은 이들의 투자 방식에 영감을 주고 있는 버핏의 명언을 살펴보겠습니다 :) 투자의 황금률"규칙 1: 절대 돈을 잃지 마라. 규칙 2: 규칙 1을 절대 잊지 마라."버핏은 손실을 피하는 것이 투자에서 가장 중요하다고 강조합니다. 예를 들어, 친구가 추천한 주식에 무작정 투자했다가 큰 손실을 본 경험이 있다면, 이 명언이 더욱 와닿을 것입니다. 투자 전에 철저한 분석과 신중한 판단이 필요함을 일깨워줍니다. 시간의 가치"10년 이상을 투자할 것이 아니면 10분도 그 주식을 가지고 있지 말아.. 2024. 11. 12. 국내 상장 ETF와 해외 상장 ETF의 세금차이 국내 상장 ETF와 해외 상장 ETF는 각각의 시장과 상품의 성격에 따라 장점과 단점이 있으므로, 본인의 목표와 투자 환경에 맞는 상품을 선택하는 것이 중요합니다. 오늘은 현명한 투자를 위해 특히 세금 측면에서!! 국내 상장 ETF와 해외 상장 ETF의 차이점을 알아보겠습니다. 국내 상장 ETF와 해외 상장 ETF의 개념국내 상장 ETF: 한국 거래소(KRX)에 상장된 ETF로, 국내 시장에서 원화로 거래되는 상품입니다. 국내 주식시장, 채권, 원자재 지수 등을 기반으로 한 ETF 상품들이 포함됩니다.해외 상장 ETF: 미국, 유럽 등 해외 거래소에 상장된 ETF로, 해당 국가의 화폐(주로 달러)로 거래되는 상품입니다. 주로 미국, 유럽, 아시아 등 전 세계 다양한 지수와 자산에 투자할 수 있습니다. 국.. 2024. 11. 11. 채권이란? 채권은 많은 분들이 이름은 들어봤지만, 정확히 무엇인지 잘 모르는 경우가 많습니다. 그래서 오늘은 채권의 개념부터 종류, 그리고 실제 투자에 필요한 기본 지식까지 쉽게 풀어보겠습니다. 채권이란?간단히 말해, 채권은 정부나 기업이 자금을 조달하기 위해 발행하는 ‘빚’이라고 할 수 있습니다. 투자자가 채권을 사는 행위는 채권을 발행한 정부나 기업에 돈을 빌려주는 것과 같습니다. 이 때, 채권의 발행자는 투자자에게 이자를 약속하고, 일정 기간 후에는 원금을 돌려줍니다. 채권의 기본 구조채권의 기본 요소는 크게 액면가 (Face Value), 표면 이자율 (Coupon Rate), 그리고 만기일 (Maturity Date)로 나눌 수 있습니다.액면가는 채권 발행자가 만기일에 투자자에게 돌려줘야 하는 금액을 말합.. 2024. 11. 10. ETF란? ETF 란?ETF(Exchange-Traded Fund, 상장지수펀드)는 주식시장에 상장된 펀드로, 쉽게 말해 특정 지수(예: KOSPI, S&P 500)나 테마(예: 기술주, 친환경 에너지)를 따라가는 '묶음' 주식 상품이라고 할 수 있습니다. ETF는 여러 종목에 분산 투자할 수 있어 위험을 낮추는 효과가 있으며, 주식처럼 매매가 가능해 유동성이 높다는 장점이 있습니다. ETF의 주요 특징과 장점다양한 종목에 분산 투자개별 주식 한 종목에 투자하면 그 종목의 주가 변동에 직접적인 영향을 받지만, ETF는 여러 종목으로 구성되어 있어 특정 종목의 주가가 하락해도 다른 종목이 이를 상쇄할 가능성이 있습니다. 따라서 상대적으로 위험 분산이 가능하죠. 예를 들어, KOSPI200 ETF는 한국의 주요 200.. 2024. 11. 9. 이전 1 2 다음