본문 바로가기

분류 전체보기118

Kaggle(캐글) - 주택 가격 예측 초보자 튜토리얼[Hellfer](3) https://www.kaggle.com/code/jimmyyeung/house-regression-beginner-catboost-top-2/notebook 🔥House Regression: Beginner Catboost (Top 2%)🚀Explore and run machine learning code with Kaggle Notebooks | Using data from multiple data sourceswww.kaggle.com 위의 글을 보고 참고하여 작성하였습니다. 데이터 전처리 (Data Preprocessing)는 데이터를 분석하거나 모델링에 사용하기 전에 데이터를 정리하고 변환하는 과정입니다. 1. 데이터 수집- 웹 스크래핑- API 활용- 데이터베이스 쿼리 2. 데이터 정제- .. 2024. 7. 8.
Kaggle(캐글) - 주택 가격 예측 초보자 튜토리얼[Hellfer](2) https://www.kaggle.com/code/jimmyyeung/house-regression-beginner-catboost-top-2/notebook 🔥House Regression: Beginner Catboost (Top 2%)🚀Explore and run machine learning code with Kaggle Notebooks | Using data from multiple data sourceswww.kaggle.com 위의 글을 보고 참고하여 작성하였습니다. 다음은 EDA(탐색적 데이터 분석)로 데이터 정보 확인, 결측치 확인, 기초 통계량 확인, 상관관계 히트맵에 대해 알아보겠습니다. 탐색적 데이터 분석(EDA)은 데이터를 시각화하고 요약하여 주요 특징을 이해하고, 패턴을 발.. 2024. 7. 8.
Kaggle(캐글) - 주택 가격 예측 초보자 튜토리얼[Hellfer](1) https://www.kaggle.com/code/jimmyyeung/house-regression-beginner-catboost-top-2/notebook 🔥House Regression: Beginner Catboost (Top 2%)🚀Explore and run machine learning code with Kaggle Notebooks | Using data from multiple data sourceswww.kaggle.com 위의 글을 보고 참고하여 작성했습니다. 먼저 아래 링크에서 데이터셋을 업로드해 보겠습니다. https://www.kaggle.com/datasets/shashanknecrothapa/ames-housing-dataset Ames Housing Dataset www.. 2024. 7. 7.
원-핫 인코딩(One Hot Encoding)이란? - [Hellfer] https://www.kaggle.com/code/dansbecker/using-categorical-data-with-one-hot-encoding Using Categorical Data with One Hot EncodingExplore and run machine learning code with Kaggle Notebooks | Using data from House Prices - Advanced Regression Techniqueswww.kaggle.com 위의 문서를 보고 참고하여 작성했습니다. 먼저 범주형 데이터가 무엇인지 알아보겠습니다. 범주형 데이터는 데이터의 값을 일정한 범주나 그룹으로 나누어 표현하는 데이터입니다. 이러한 범주는 서로 명확히 구분되며, 순서나 크기를 비교할 수 없.. 2024. 7. 5.
백준 - 7795번 먹을 것인가 먹힐 것인가 python 문제풀이 [Hellfer] 🔷 알고리즘 분류 - 정렬, 두 포인터,  난이도 - 실버 3 문제 심해에는 두 종류의 생명체 A와 B가 존재한다. A는 B를 먹는다. A는 자기보다 크기가 작은 먹이만 먹을 수 있다. 예를 들어, A의 크기가 {8, 1, 7, 3, 1}이고, B의 크기가 {3, 6, 1}인 경우에 A가 B를 먹을 수 있는 쌍의 개수는 7가지가 있다. 8-3, 8-6, 8-1, 7-3, 7-6, 7-1, 3-1.   두 생명체 A와 B의 크기가 주어졌을 때, A의 크기가 B보다 큰 쌍이 몇 개나 있는지 구하는 프로그램을 작성하시오. 입력 첫째 줄에 테스트 케이스의 개수 T가 주어진다. 각 테스트 케이스의 첫째 줄에는 A의 수 N과 B의 수 M이 주어진다. 둘째 줄에는 A의 크기가 모두 주어지며, 셋째 줄에는 B의 크기.. 2024. 7. 2.
백준 - 1940번 주몽 python 문제풀이 [Hellfer] 🔷 알고리즘 분류 - 정렬, 두 포인터난이도 - 실버 4  문제 주몽은 철기 군을 양성하기 위한 프로젝트에 나섰다. 그래서 야철대장을 통해 철기 군이 입을 갑옷을 만들게 하였다. 야철대장은 주몽의 명에 따르기 위하여 연구에 착수하던 중 아래와 같은 사실을 발견하게 되었다.갑옷을 만드는 재료들은 각각 고유한 번호를 가지고 있다. 갑옷은 두 개의 재료로 만드는데 두 재료의 고유한 번호를 합쳐서 M(1 ≤ M ≤ 10,000,000)이 되면 갑옷이 만들어지게 된다. 야철대장은 자신이 만들고 있는 재료를 가지고 갑옷을 몇 개나 만들 수 있는지 궁금해졌다. 이러한 궁금증을 풀어 주기 위하여 N(1 ≤ N ≤ 15,000) 개의 재료와 M이 주어졌을 때 몇 개의 갑옷을 만들 수 있는지를 구하는 프로그램을 작성하시.. 2024. 7. 1.
Kaggle(캐글) - 타이타닉 생존자 예측 초보자 튜토리얼[Hellfer](5) https://www.kaggle.com/code/shivadumnawar/titanic-a-complete-tutorial-for-beginners Titanic : A Complete Tutorial For BeginnersExplore and run machine learning code with Kaggle Notebooks | Using data from multiple data sourceswww.kaggle.com 위의 튜토리얼을 보고 참고하여 진행하였습니다. 다음은 5번째인 머신러닝으로 데이터를 학습하고 파일을 제출해 보겠습니다. 머신러닝 알고리즘은 데이터를 기반으로 학습하고, 이를 통해 예측이나 결정을 내리는 알고리즘입니다. 크게 지도 학습, 비지도 학습, 강화 학습으로 나눌 수 있습니다.. 2024. 6. 29.
Kaggle(캐글) - 타이타닉 생존자 예측 초보자 튜토리얼[Hellfer](4) https://www.kaggle.com/code/shivadumnawar/titanic-a-complete-tutorial-for-beginners Titanic : A Complete Tutorial For BeginnersExplore and run machine learning code with Kaggle Notebooks | Using data from multiple data sourceswww.kaggle.com 위의 튜토리얼을 보고 참고하여 진행하였습니다. 다음은 4번째인 이상치 제거하고  원-핫 인코딩을 과정을 수행해 보겠습니다.데이터의 이상치를 확인해 보겠습니다. train.plot(kind='box', figsize=(10,8))    'Age', 'SibSp', 'Parch', '.. 2024. 6. 28.
Kaggle(캐글) - 타이타닉 생존자 예측 초보자 튜토리얼[Hellfer](3) https://www.kaggle.com/code/shivadumnawar/titanic-a-complete-tutorial-for-beginners Titanic : A Complete Tutorial For BeginnersExplore and run machine learning code with Kaggle Notebooks | Using data from multiple data sourceswww.kaggle.com 위의 튜토리얼을 보고 참고하여 진행하였습니다. 다음은 3번째 단계인 데이터 시각화에 대해 알아보겠습니다 데이터 시각화란?- 데이터를 그래프나 차트 형태로 표현하여 패턴, 추세, 이상치 등을 직관적으로 파악할 수 있습니다. 종류1. 막대그래프 (Bar graph)- 범주형 데이터의 .. 2024. 6. 28.
Kaggle(캐글) - 타이타닉 생존자 예측 초보자 튜토리얼[Hellfer](2) https://www.kaggle.com/code/shivadumnawar/titanic-a-complete-tutorial-for-beginners Titanic : A Complete Tutorial For BeginnersExplore and run machine learning code with Kaggle Notebooks | Using data from multiple data sourceswww.kaggle.com 위의 튜토리얼을 보고 참고하여 진행하였습니다. 다음은 2번째 단계인 데이터 누락된 값 처리에 대해 알아보겠습니다. 데이터 전처리란?- 데이터 분석 또는 머신러닝 모델 학습을 위해 데이터를 준비하는 과정으로 과정은 다음과 같습니다. 1. 데이터 수집 (Data Collection) .. 2024. 6. 28.