다양한 AI 예측 모델

말파고에서 실험하고 연구 중인 최첨단 AI 모델들을 소개합니다

실험 및 연구 중인 모델들

대규모 언어 모델 (Large Language Models)

구조화된 프롬프트를 통해 경주 데이터를 입력받아 확률, 순위, 설명 및 인사이트를 추출하는 모델들입니다.

GPT (OpenAI)

OpenAI의 대규모 언어 모델로, 경마 예측에 있어서는 균형잡힌 분석과 종합적인 판단 능력을 제공합니다.

활용 분야

  • 전문가 예상지 분석
  • 경주 전략 수립
  • 종합 판단 예측

특징

  • 균형잡힌 종합 분석
  • 다양한 데이터 소스 통합
  • 안정적인 예측 성능

Gemini (Google)

Google의 멀티모달 AI 모델로, 텍스트, 이미지, 비디오 등 다양한 형태의 데이터를 처리할 수 있습니다. 경마 예측에서는 전문가 분석 자료와 이미지 데이터를 종합적으로 분석하는 데 활용됩니다.

활용 분야

  • 경마문화 PDF 분석
  • 전문가 의견 종합
  • 실시간 웹 검색 기반 분석

특징

  • 멀티모달 데이터 처리
  • 심층 추론 능력
  • 대용량 컨텍스트 처리

Perplexity

실시간 웹 검색 기능을 내장한 AI 모델로, 최신 정보를 즉시 반영하여 예측을 수행합니다. 경마 예측에서는 최신 뉴스, 기수/조교사 인터뷰, 경주 전 상황 등을 실시간으로 분석하는 데 활용됩니다.

활용 분야

  • 실시간 검색 기반 예측
  • 최신 뉴스 반영 분석
  • 경주 직전 상황 분석

특징

  • 실시간 정보 반영
  • 웹 검색 기반 최신 데이터
  • 동적 상황 분석

Claude (Anthropic)

Anthropic에서 개발한 AI 모델로, 안전성과 정확성을 중시하는 설계로 만들어졌습니다. 경마 예측에서는 신중하고 신뢰할 수 있는 분석을 제공하며, 복잡한 상황에서도 일관된 판단을 내립니다.

활용 분야

  • 심층 추론 기반 예측
  • 복잡한 상황 분석
  • 신뢰도 높은 판단

특징

  • 신중하고 정확한 분석
  • 복잡한 추론 능력
  • 일관된 판단 기준

순위 예측용 머신러닝 모델

경주마 간의 상대적 우위를 분석하여 순위를 매기는 모델들입니다. 말·기수·조교사·전개·주로상태·배당 등 구조화된 데이터를 입력받아 각 말의 승·연승 확률, 입상 확률을 추정하고 순위를 예측합니다.

트리 기반 앙상블 모델

Random Forest (RF)

여러 개의 결정트리를 앙상블해 예측하는 모델로, 경마 결과 예측에서 강력한 성능을 보여주는 대표적인 모델입니다.

Gradient Boosting Machines (XGBoost, LightGBM, CatBoost)

트리 기반 부스팅 방식으로 순위/승률 예측 정밀도 향상에 유리하며, 정형 데이터(성적, 기수, 부담중량 등) 처리에 가장 강력합니다.

핵심 기법: LambdaRank 혹은 Listwise 방식을 적용하여 전체 경주마의 상대적 순위를 최적화합니다. 베팅 ROI 평가/순위 점수 계산 등에 활용 가능합니다.

Learning to Rank (LTR) 모델

"각 말을 개별 점수화"보다 "말 A가 말 B보다 앞선다" 같은 상대 순위를 직접 학습하는 방식입니다.

구현 방식

  • Pointwise: 각 말을 개별적으로 점수화
  • Pairwise: 말 쌍 간의 상대적 순위 학습
  • Listwise: 전체 말 리스트의 순위를 직접 최적화

RankNet, LambdaRank, LambdaMART 계열을 사용하여 경주별 말 리스트를 입력으로 넣어 전체 순위를 출력합니다.

참고: 서울 경마 데이터를 LTR로 순위 예측한 국내 논문이 이미 존재합니다.

시계열/딥러닝 모델

LSTM 및 Transformer

각 말의 최근 레이스 히스토리를 시계열로 넣어 폼 흐름을 추적하고, 마지막 타임스텝에서 승률·입상률을 예측합니다.

경주마의 과거 전적 흐름(Time-series)을 분석하여, 특정 말이 최근 상승세인지, 특정 거리에서 반복적으로 강세를 보이는지 등 패턴 분석에 최적화되어 있습니다.

Temporal CNN 등

시계열 데이터를 처리하는 CNN 변형 모델로, 시간적 패턴을 효과적으로 포착합니다.

이후 확률을 정렬해 순위를 만들고, LTR와 결합하면 개선 가능합니다.

심층 신경망 (Deep Neural Networks - MLP)

수많은 변수 간의 비선형적 관계를 포착하는 데 유리하며, 경주마의 신체 조건, 날씨, 주로 상태 등 복잡한 데이터가 결합될 때 높은 성능을 발휘합니다.

GPU 필요, 과적합 주의

기타 전통적 머신러닝 모델

k-Nearest Neighbors (k-NN)

비슷한 과거 경주를 찾아 현재 경주 결과를 예측합니다. 이해는 쉬우나 데이터가 많을수록 계산 비용이 증가합니다.

Naive Bayes / Logistic Regression

기본적인 확률 기반 분류 모델입니다. 성능은 낮을 수 있으나 빠른 베이스라인 평가용으로 유용합니다.

Stacked/Ensemble 모델

위 모델들의 예측을 결합하여 단일 모델보다 안정성을 높입니다. 다중 모델 예측의 평균/가중합 등을 활용하여 더 신뢰할 수 있는 예측을 제공합니다.

베팅 전략 최적화 모델

예측된 확률을 바탕으로 실제 수익을 극대화하기 위한 모델들입니다.

Kelly Criterion (켈리 기준)

순위/승률 모델이 내놓은 "주관 확률"과 실제 배당을 비교해 기댓값이 플러스인 말에만 베팅하고, 파산 위험을 최소화하면서 자산 성장률을 극대화하는 베팅 비율을 계산합니다.

켈리 공식

f* = (bp - q) / b

(단, q = 1-p, p=모델 추정 승률, b=배당-1)

여러 말/복수 결과에 대한 확장도 연구되었으며, 경마처럼 여러 결과가 존재할 때도 확장 가능합니다.

실전에서는 변동성 줄이려고 1/2 Kelly 등 fractional Kelly를 많이 사용합니다.

가치 베팅(Value Betting) 분류 모델

"이 베팅이 장기적으로 수익이 났는지 여부"를 0/1로 라벨링하고, 배당·예상 확률·시장 인기 등을 입력으로 학습합니다.

단순 승률이 아니라 ROI가 플러스일 조합만 골라내는 필터로 사용하여, 장기적으로 수익성이 있는 베팅만 선별합니다.

Expected Value / Fair Odds 모델링

AI가 예측한 실제 확률을 "공정 배당(Fair Odds)"으로 변환하여 시장의 배당과 비교함으로써 시장 오차를 찾아 가치 있는 베팅 기회를 발견합니다.

ML + 전략 시뮬레이션 프레임워크

Random Forest / XGBoost 등으로 승률을 예측한 후, 여러 베팅 규칙(플랫 베팅, Kelly, 퍼센트 베팅)을 과거 데이터에 시뮬레이션하여 최대 환수율/최저 최대낙폭(drawdown)을 기준으로 최적 전략을 선택합니다.

시뮬레이션 기반 전략 최적화

과거 데이터로 Monte-Carlo 시뮬레이션을 수행하여 베팅 시나리오별 기대수익을 비교하고, 다양한 전략 중 가장 효과적인 방법을 선택합니다.

강화학습 (Reinforcement Learning - PPO, DQN)

베팅을 하나의 '에이전트'로 설정하여, 다양한 베팅 조합(단승, 복승, 삼복승 등) 중 보상(환급금)이 가장 높은 전략을 스스로 학습합니다.

고정된 공식이 아니라 시장의 배당판 변화에 유연하게 대응할 수 있으며, 배당 이동과 실시간 베팅 환경을 반영한 동적 베팅 정책을 학습합니다.

Plackett-Luce 모델

확률 기반 통계 예측 모델

Plackett-Luce 모델은 순위 데이터를 분석하는 확률 모델로, 경마 예측에 매우 적합합니다. 이 모델은 각 말의 상대적 강도를 확률적으로 계산하여 순위 예측을 제공합니다.

주요 특징

  • 순위 데이터의 확률적 모델링
  • 각 말의 승률 및 순위 확률 계산
  • 통계적 신뢰도 제공
  • 과거 경주 데이터 기반 학습

통합 예측 시스템

말파고는 위의 다양한 AI 모델들을 종합하여 더욱 정확한 예측을 제공합니다. 각 모델의 장점을 결합하고, 전문가 분석과 통계 데이터를 함께 활용하여 최종 예측 결과를 도출합니다.

다양성

여러 AI 모델의 다양한 관점을 종합

정확성

각 모델의 강점을 활용한 정밀 분석

신뢰성

검증된 모델들의 합의 기반 예측

실험 결과 공개 예정

말파고는 위의 다양한 AI 모델들을 실제 경마 데이터에 적용하여 지속적으로 실험하고 연구하고 있습니다. 각 모델의 성능, 정확도, ROI 등에 대한 실험 결과를 앞으로 하나씩 공개할 예정입니다.

최신 실험 결과와 모델 성능 업데이트를 확인하려면 정기적으로 이 페이지를 방문해주세요.

🐎
🐎

마파 AI

경마 AI 어시스턴트
🐎

마파에게 물어보세요!

경마 분석, 배당률 해석, 마권 전략

경마 기초
배당률
출마표
마권 종류