Thesis/Data Analysis

[Thesis] Data Analysis - 빅데이터 기반 프로야구 데이터 분석(저널)

gangee 2024. 4. 2. 13:47

목차

    728x90
    반응형

    서론

    • 최근 대한민국에서 프로야구가 가장 핫한 스포츠로 떠오르고 있으며, 이를 바탕으로 특정 프로야구단을 응원하는 팬들의 증가로 인한 데이터 분석의 필요성이 대두 됨

    본론

    1. 관련 기술 : 크롤링, 셀레늄, 하이브, R 등
    2. 데이터 수집 및 처리
      • 크롤링, 셀레늄 : 기사 데이터 수집, KBO 사이트를 통해 프로야구 성적 및 관중 데이터 추출
      • 데이터 처리 : 하이브 이용하여 처리, 필요에 따라 데이터 정형화
    3. 분석 결과
      1. 특정 프로야구단의 기사 빈도 분석
        • 데이터를 로드하여 그래프로 표현하였으며, 2013년 후반에 특정 프로야구단 관련 기사가 높은 빈도로 나타남
      2. 특정 프로야구단의 워드클라우드 분석
        • KoNLP 형태소 분석 및 wordcloud 패키지를 사용하여 특정 프로야구단 관련 기사의 주요 키워드 시각화
      3. 프로야구 성적과 관중 수 분석
        • 년도별 및 월별 관중 수 증감률을 계산하고 그래프로 표현하여 관중의 변화 확인
        • 특정 프로야구단의 년도별 순위를 그래프로 표현하여 성적 변동 분석
      4. 타자 타율과 출루율 성적 분석
        • KBO 데이터를 활용하여 타자들의 타율 및 출루율 성적을 분석하고 그래프로 시각화
        • 각 년도별 타율 및 출루율 성적 상위 선수들 확인

    결론

    • 향후 SNS에서의 감정 분석과 타율과 출루율의 상관 관계에 대한 추가적인 분석이 필요하다는 결론 도출
    • 이를 통해 보다 정확하고 심층적인 프로야구 데이터 분석이 가능할 것으로 예상
      • 출루율 : 야구 경기에서 타자가 베이스에 얼마나 많이 살아 나갔는지를 백분율로 나타낸 수치

    출처

    1. 논문 이름 : 빅데이터 기반 프로야구 데이터 분석
    2. 저자 : 신동진, 황승연, 이돈희, 문진용, 김정준
    728x90
    반응형