Introduction

KRX 금융 언어 모델 경진대회는 참가자들이 KRX-Bench 파이프라인으로 생성된 벤치마크 데이터셋에서 고득점을 목표로 금융 특화 언어 모델을 자체적으로 개발하는 대회입니다. 이번 대회의 핵심인 벤치마크 리더보드 데이터셋은 KRX-Bench 벤치마크 생성 파이프라인을 통해 만들어졌습니다. KRX-Bench 파이프라인은 OneLineAIKRX에서 공동으로 작업한 “KRX-Bench: Automating Financial Benchmark Creation via Large Language Models” 논문에서 제안된 파이프라인으로, LREC-COLING 2024 FinNLP에서 발표되었습니다.

이러한 배경 하에서, 본 경진대회는 최신 금융 NLP 연구의 실제 적용을 탐구하기 위해 단순히 기존 모델의 성능을 평가하는 것을 넘어, 참가자들이 실제 금융 시장의 복잡성과 역동성을 반영한 고품질 데이터셋을 바탕으로 새로운 언어 모델을 개발하고 최적화할 수 있는 기회를 제공합니다. 이를 통해 참가자들은 단순 fine-tuning을 넘어서 금융 텍스트의 특수성과 전문성을 깊이 이해하고, 이를 효과적으로 처리할 수 있는 혁신적인 접근 방식을 고안하도록 유도하여 금융 도메인 특화 언어 모델을 처음부터 개발하도록 장려됩니다.

다음으로, 본 경진대회의 기본 배경지식, 튜토리얼, 참가방법 및 FAQ에 대해 자세히 설명드리겠습니다. 이를 통해 참가자 여러분께서 대회의 목표와 요구사항을 명확히 이해하고, 성공적인 참여를 위한 준비를 할 수 있기를 바랍니다.

KRX-Bench

Tutorial

튜토리얼

본 튜토리얼은 KRX 금융 언어 모델 경진대회 참가자들을 위해 제작되었습니다. 튜토리얼의 주요 내용은 금융 합성 데이터셋 생성과 효율적인 금융 특화 언어 모델 instruction tuning에 초점을 맞추고 있고, 참가자들은 튜토리얼을 통해 금융 도메인에 특화된 합성 데이터를 생성하는 방법과 이를 활용하여 금융 특화 언어 모델을 학습시키는 방법을 익힐 수 있습니다. 본 튜토리얼은 각 과정에 대한 설명과 함께, 실제 구현에 필요한 핵심 개념과 방법론을 실제 구현 코드와 함께 제공하며, 본 튜토리얼 진행을 위해서는 OpenAI API key와 Colab Free 환경을 필요로 합니다.

  1. 금융 합성 데이터셋 생성 (raw text & web text)
  2. 금융 특화 언어 모델 instruction tuning

Tutorial

Description

대회 안내

Media

원라인에이아이, 한국거래소와 'KRX-벤치' 개발..국제학회 발표 - 머니투데이

원라인에이아이, 한국거래소와 'KRX-Bench'발표

FinNLP-KDF-ECONLP@LREC-COLING-2024 - Accepted Papers