728x90

Thesis/Data Analysis 7

[Thesis] Data Analysis - 빅데이터 분석에 기반한 아동학대의 이해

서론 인공지능 기술을 이용한 암 진단의 중요성을 강조 본론 딥러닝 알고리즘을 활용하여 의료 영상 데이터를 분석하는 방법 제시 및 이를 통해 얻은 새로운 접근 방식의 성능을 보여줌 종양의 특징을 식별하고 분류하는 과정을 설명하며, 실험 결과를 통해 효과 입증 결론 새로운 접근 방식이 기존의 방법보다 더 높은 정확도를 가짐을 보여줌 의료 분야에서 인공지능 기술의 활용 가능성을 강조하며, 향후 연구 방향에 대한 제언 제시 출처 논문 이름 : 빅데이터 분석에 기반한 아동학대의 이해 저자 : 배정호, 범은애 출처 : 빅데이터 분석에 기반한 아동학대의 이해 -머신러닝 알고리즘 개발 기초연구-

[Thesis] Data Analysis - Temporal Fusion Transformers와 심층 학습 방법을 사용한 다층 수평 시계열 데이터 분석(학술)

서론 다층 수평 예측 : 기계 학급에서 시계열 데이터를 사용한 중요한 문제 중 하나 시계열 데이터는 다차원 형태를 가지며 다양한 정보를 포함하기 때문에 전통적인 방법을 사용하면 정확한 예측 어렵 시계열 정보는 실수형, 범주형 등의 이질적인 형태를 가지며 서로의 관계에 대한 정보 매우 적게 제공 본 논문은 이러한 한계점을 보완하고자 함 본론 실생활과 밀접한 관련이 있는 3가지 공개 데이터를 이용하여 실험 진행 3가지 공개 데이터 : 주식 데이터, 미세먼지 데이터, 전기 변압기 데이터 기존 시계열 예측 모델인 단층 LSTM모델, 다층 LSTM모델, 1D CNN 모델 과 TFT 방법을 이용해 각각의 정확도 비교 TFT 방법과 기존 방법들의 성능 차이 매우 큼 다층 LSTM 모델의 MSE 값은 약 6.5배 차이..

[Thesis] Data Analysis - 빅데이터 기반 프로야구 데이터 분석(저널)

서론 최근 대한민국에서 프로야구가 가장 핫한 스포츠로 떠오르고 있으며, 이를 바탕으로 특정 프로야구단을 응원하는 팬들의 증가로 인한 데이터 분석의 필요성이 대두 됨 본론 관련 기술 : 크롤링, 셀레늄, 하이브, R 등 데이터 수집 및 처리 크롤링, 셀레늄 : 기사 데이터 수집, KBO 사이트를 통해 프로야구 성적 및 관중 데이터 추출 데이터 처리 : 하이브 이용하여 처리, 필요에 따라 데이터 정형화 분석 결과 특정 프로야구단의 기사 빈도 분석 데이터를 로드하여 그래프로 표현하였으며, 2013년 후반에 특정 프로야구단 관련 기사가 높은 빈도로 나타남 특정 프로야구단의 워드클라우드 분석 KoNLP 형태소 분석 및 wordcloud 패키지를 사용하여 특정 프로야구단 관련 기사의 주요 키워드 시각화 프로야구 성..

[Thesis] Data Analysis - 최적의 병원입지선정을 위한 분석방법 연구(KCI)

서론 한계 병원입지선정의 중요성과 어려움 정보의 어려운 접근성과 복잡성 건강보험심사평가원의 노력과 정보 서비스의 한계 한계 극복 병원입지선정 정보의 구성요소 추출과 분석모형 설계 필요성 강조 본론 병원입지선정 정보의 분석구조와 구성요소를 개선하고, 미래경영 예측이 가능한 정보를 제공하기 위한 연구 수행 가정된 사례(인천 구월1동 산부인과 병원)를 통해 사례연구 수행 의료수요 및 상주인구, 유동인구 등을 분석하여 최적 병원입지 선정의 필요성을 제시 병원입지선정 정보서비스의 확대와 국가적인 지원 필요성을 제언 결론 병원입지선정 정보의 정확성과 효용성이 보장되어야 함을 강조. 병원입지선정 정보의 구성요소 추출과 분석모형 설계를 통해 안정적인 의료 공급을 위한 미래예측 경영정보 제공이 가능함을 확인. 국가적인 ..

[Thesis] Data Analysis - 공공데이터를 활용한 초등학생 돌봄시설의 최적입지 선정(KCI)

서론 이 연구는 정부의 생활 SOC 확대 정책에 따라 기존 시설을 활용하여 초등학생 돌봄시설의 최적 입지를 선정하는 것을 목표로 함 최적 입지 선정을 위해 공간최적화 모델과 공공데이터 활용 p-median 모델을 통해 최종 돌봄시설 선택 본론 서울시 송파구를 대상으로 실험 수행 후보시설의 입지기준을 공공데이터를 활용하여 평가 100M×100M 격자를 기본 공간단위로 설정하여 후보시설의 입지기준을 평가하고, 최종 돌봄시설을 선정 결론 생활 SOC 확대 정책을 고려하여 초등학생 돌봄시설의 최적 입지를 선정하는데 성공 데이터의 다양한 형식과 자료원을 고려하는 과정에서 입지 기준의 미흡한 부분 발생 향후, 미흡한 부분을 보완하기 위해 수요자들의 의견을 반영할 수 있는 데이터 확장이 필요 출처 논문 이름 : 공공..

[Thesis] Data Analysis - 소셜네트워크서비스 기반 데이터를 이용한 빅데이터 분석(학술)

서론 빅데이터 분석을 통해 "일자리"에 대한 대중 인식을 살펴보는 빅데이터 분석 실시 사회 매트릭스 프로그램 이용. 사회 매트릭스 : 블로그, 트위터 같은 사회 데이터 기반으로 네트워크 구조 분석 제공 빅데이터 분석은 대규모 데이터셋에서 의미 있는 패턴, 상관관계 등을 찾아 새로운 가치 창출. 대부분의 산업이 빅데이터를 활용하여 새로운 가치 창출에 노력 중. 본론 분석 목적 : 빅데이터를 분석하고 "일자리"와 관련된 이미지 및 대중의 긍정적 및 부정적 의견 성향을 비교 분석하는 것 카카오, 페이스북은 비공개 사회 네트워크 서비스로 분석 X 네이버, 블로그, 트위터 데이터 사용하여 분석 진행 결론 사회 매트릭스를 이용한 "일자리" 대중 인식 조사 결과 "능력", "소녀", "영웅 캐릭터" 등 관련 키워드 ..

[Thesis] Data Analysis - 공공데이터 기반 화재 발생 요인 분석 (학술)

서론 화재 발생건 수는 2022년부터 점점 증가하는 추세 데이터 수집 기관 : 공공데이터포털, 소방청 수집 데이터 : 화재 발생 건수, 시도별 공장 수와 인구수, 계절별 화재 발생수 등 R studio 사용한 자료 분석 데이터 시각화를 통한 분석 결과 제시 본론 선행연구를 통한 화재 발생 원인 가설 제조업체나 공장의 분포 : 경기도지역에 비교적 많음 다른 계절에 비해 겨울철에 발생률 높을 것 인구 밀도가 높은 지역 원인별 가설에 대한 분석 결과 2-1. 경기도지역의 비교적 많은 제조업체나 공장의 분포가 높은 화재 발생률의 원인이 된다. 시도별 공장 수/시도별 인구수 대조 경기도 지역을 제외한 나머지 지역에서 비례하지 않음 2-2. 겨울철이 다른 계절에 비해 화재 발생률이 더 높을 것이다. 분기별 데이터 ..

반응형