본문 바로가기

캐글(Kaggle)/프로젝트9

Kaggle(캐글) - 주택 가격 예측 초보자 튜토리얼[Hellfer](4) https://www.kaggle.com/code/jimmyyeung/house-regression-beginner-catboost-top-2/notebook 🔥House Regression: Beginner Catboost (Top 2%)🚀Explore and run machine learning code with Kaggle Notebooks | Using data from multiple data sourceswww.kaggle.com 위의 글을 보고 참고하여 작성하였습니다. 마지막으로 모델링하고 제출해 보겠습니다.   pd.get_dummies() 함수는 범주형 변수를 원 - 핫 인코딩하여 새로운 이진 함수를 생성합니다. train_test_dummy = pd.get_dummies(train_.. 2024. 7. 8.
Kaggle(캐글) - 주택 가격 예측 초보자 튜토리얼[Hellfer](3) https://www.kaggle.com/code/jimmyyeung/house-regression-beginner-catboost-top-2/notebook 🔥House Regression: Beginner Catboost (Top 2%)🚀Explore and run machine learning code with Kaggle Notebooks | Using data from multiple data sourceswww.kaggle.com 위의 글을 보고 참고하여 작성하였습니다. 데이터 전처리 (Data Preprocessing)는 데이터를 분석하거나 모델링에 사용하기 전에 데이터를 정리하고 변환하는 과정입니다. 1. 데이터 수집- 웹 스크래핑- API 활용- 데이터베이스 쿼리 2. 데이터 정제- .. 2024. 7. 8.
Kaggle(캐글) - 주택 가격 예측 초보자 튜토리얼[Hellfer](2) https://www.kaggle.com/code/jimmyyeung/house-regression-beginner-catboost-top-2/notebook 🔥House Regression: Beginner Catboost (Top 2%)🚀Explore and run machine learning code with Kaggle Notebooks | Using data from multiple data sourceswww.kaggle.com 위의 글을 보고 참고하여 작성하였습니다. 다음은 EDA(탐색적 데이터 분석)로 데이터 정보 확인, 결측치 확인, 기초 통계량 확인, 상관관계 히트맵에 대해 알아보겠습니다. 탐색적 데이터 분석(EDA)은 데이터를 시각화하고 요약하여 주요 특징을 이해하고, 패턴을 발.. 2024. 7. 8.
Kaggle(캐글) - 주택 가격 예측 초보자 튜토리얼[Hellfer](1) https://www.kaggle.com/code/jimmyyeung/house-regression-beginner-catboost-top-2/notebook 🔥House Regression: Beginner Catboost (Top 2%)🚀Explore and run machine learning code with Kaggle Notebooks | Using data from multiple data sourceswww.kaggle.com 위의 글을 보고 참고하여 작성했습니다. 먼저 아래 링크에서 데이터셋을 업로드해 보겠습니다. https://www.kaggle.com/datasets/shashanknecrothapa/ames-housing-dataset Ames Housing Dataset www.. 2024. 7. 7.
Kaggle(캐글) - 타이타닉 생존자 예측 초보자 튜토리얼[Hellfer](5) https://www.kaggle.com/code/shivadumnawar/titanic-a-complete-tutorial-for-beginners Titanic : A Complete Tutorial For BeginnersExplore and run machine learning code with Kaggle Notebooks | Using data from multiple data sourceswww.kaggle.com 위의 튜토리얼을 보고 참고하여 진행하였습니다. 다음은 5번째인 머신러닝으로 데이터를 학습하고 파일을 제출해 보겠습니다. 머신러닝 알고리즘은 데이터를 기반으로 학습하고, 이를 통해 예측이나 결정을 내리는 알고리즘입니다. 크게 지도 학습, 비지도 학습, 강화 학습으로 나눌 수 있습니다.. 2024. 6. 29.
Kaggle(캐글) - 타이타닉 생존자 예측 초보자 튜토리얼[Hellfer](4) https://www.kaggle.com/code/shivadumnawar/titanic-a-complete-tutorial-for-beginners Titanic : A Complete Tutorial For BeginnersExplore and run machine learning code with Kaggle Notebooks | Using data from multiple data sourceswww.kaggle.com 위의 튜토리얼을 보고 참고하여 진행하였습니다. 다음은 4번째인 이상치 제거하고  원-핫 인코딩을 과정을 수행해 보겠습니다.데이터의 이상치를 확인해 보겠습니다. train.plot(kind='box', figsize=(10,8))    'Age', 'SibSp', 'Parch', '.. 2024. 6. 28.
Kaggle(캐글) - 타이타닉 생존자 예측 초보자 튜토리얼[Hellfer](3) https://www.kaggle.com/code/shivadumnawar/titanic-a-complete-tutorial-for-beginners Titanic : A Complete Tutorial For BeginnersExplore and run machine learning code with Kaggle Notebooks | Using data from multiple data sourceswww.kaggle.com 위의 튜토리얼을 보고 참고하여 진행하였습니다. 다음은 3번째 단계인 데이터 시각화에 대해 알아보겠습니다 데이터 시각화란?- 데이터를 그래프나 차트 형태로 표현하여 패턴, 추세, 이상치 등을 직관적으로 파악할 수 있습니다. 종류1. 막대그래프 (Bar graph)- 범주형 데이터의 .. 2024. 6. 28.
Kaggle(캐글) - 타이타닉 생존자 예측 초보자 튜토리얼[Hellfer](2) https://www.kaggle.com/code/shivadumnawar/titanic-a-complete-tutorial-for-beginners Titanic : A Complete Tutorial For BeginnersExplore and run machine learning code with Kaggle Notebooks | Using data from multiple data sourceswww.kaggle.com 위의 튜토리얼을 보고 참고하여 진행하였습니다. 다음은 2번째 단계인 데이터 누락된 값 처리에 대해 알아보겠습니다. 데이터 전처리란?- 데이터 분석 또는 머신러닝 모델 학습을 위해 데이터를 준비하는 과정으로 과정은 다음과 같습니다. 1. 데이터 수집 (Data Collection) .. 2024. 6. 28.
Kaggle(캐글) - 타이타닉 생존자 예측 초보자 튜토리얼[Hellfer](1) https://www.kaggle.com/code/shivadumnawar/titanic-a-complete-tutorial-for-beginners Titanic : A Complete Tutorial For BeginnersExplore and run machine learning code with Kaggle Notebooks | Using data from multiple data sourceswww.kaggle.com 위의 튜토리얼을 보고 참고하여 진행하였습니다. step1. 데이터 분류란 무엇인가?2. 로지스틱 회귀란 무엇인가?3. import4. 누락된 값 처리5. 데이터 시각화6. 이상값 제거7. 원 - 핫 인코딩8. Feature Scaling9. 제출 분류란 무엇인가?- 분류 대상이 범.. 2024. 6. 27.