WEB + AI실무프로젝트 9

5. 개, 고양이, 호랑이 구분하기

개요 비지도 학습으로 개와 고양이를 섞어서 보여주고 Clustering으로 구분해 본다. 즉 생심새 만으로 구분할 수 있을지 실험해 본다. 이미지 분석이므로 Import Images 아이콘을 불러온다. clustering Images 폴더를 찾아 선택한 후 open을 클릭한다. Image Viewer 아이콘을 클릭하여 사진을 확인한다. 이미지를 분석하기 위해 Image Viewer의 오른쪽 바에서 드래그를 해 Image Embedding을 불러온다. 구글 Inception v3를 사용한다. k-Means를 적용해 본 후 인공지능이 제안한 클러스터 개수를 확인한다. 인공지능은 6개로 분류하라고 되어 있으나 일단 3개로 분류한다. Image Viewer를 불러 온 후 Title Attribute를 Clust..

4. Clustering : 쇼핑몰 고객 세분화하기

쇼핑몰 고객 그룹 나누기 고객의 성별, 나이, 연 수입과 소비 점수의 데이터를 가지고 Clustering을 해 본다. 칼럼 중 'Customer ID'는 고객 특성을 나누는데 의미 있는 자료가 아니므로 Role을 'skip'으러 변경한다. Clustering File에서 오른쪽으로 선을 그어 뺀 후 선택창에서 'k-Means' 아이콘을 선택한다. k-Means는 Clustering에서 자주 사용하는 대표적인 모델이다. k-Means의 k는 임의의 값으로 분석가가 원하는 숫자를 말하면 그에 맞춰서 그룹 개수를 만들어 준다. Cluster의 수를 From~to를 선택하면 해당 범위에서 가장 가장 적절한 그룹 개수를 알려준다. Silhoutte Scores가 1에 가까울수록 적절하다는 뜻이므로 6개로 나누는 ..

3. 아이오와 집값 예측하기

주관식 예측 Yes, No 가 아닌 숫자 자체를 예측해 보는 것이다. 여기서 말하는 집값 예측이란 집값이 앞으로 오를 건지 내릴 건지를 예측하는 것이 아니고 조건이 이럴 경우(방이 몇 개라든지, 방향이 어느 쪽이라든지, 역에서 얼마만큼 떨어져 있다든지 등) 집값이 대략 얼마 정도 할 것이라고 짐작해 보는 예측을 의미한다. 파일을 불러온 후 '아이오와 집값 예측_공부' 파일을 로드시킨다. 집값을 예측하는 것이므로 제일 마지막에 SalePrice 변수의 Role을 Target으로 변경한다. 수많은 변수들 중 어떤 변수가 Target 즉, 집값에 영향을 끼치는지 보고 싶다면 파일에서 Rank을 연결한다. 결과를 보니 이웃, 2층 외관, BSM 노출 등이 집값에 가장 영향을 끼치는 것으로 나타났다. 회귀 분석 ..

2. CT 사진으로 암 진단하기

병원에서 많이 사용하는 CT 사진 Image Analytics 메뉴가 없다면 Options의 'Add-Ons'에서 Image Analytics를 Install 한다. 'Image Analytics'의 'Import Images'를 오른쪽 화면으로 드래그한다. 'Import Images'를 더블클릭하여 '공부'폴더를 선택한다. 이미지를 컴퓨터가 이해할 수 있도록 Image Embedding 한다. Image Embedding 된 것을 확인하기 위하여 Data Table을 불러온다. 불러온 이미지 파일에 대한 기본 정보(크기, 너비, 높이 등)가 나온다. 임베딩 된 이미지의 Data Table을 확인하면 기본 정보 외에 n0, n1,n2,....n2047 까지 새로운 열이 생긴 것을 확인할 수 있다. 컴퓨터..

1. 이직할 직원 예측하기

1.1 개요 요즘 회사들의 큰 고민 중 하나는 직원들의 이직이다. 직원이 조만간 이직을 할지 안 할지를 예측하는 모델을 만들어 보자. 다음과 같은 과정을 수행한다. 우선 기존 직원들의 정보(나이, 성별, 출신학교, 전공, 부서, 연봉 등 회사에서 수집 가능한 모든 데이터)를 수집한다. 그 결과 현재 그 직원이 이직했는지 안 했는지를 표시한다. 그 다음 직원 정보와 이직 유무라는 결과 사이에 어떤 관계가 있는지 인공지능에서 학습시킨다. 대표적인 모델 4개 선택 Neural Network Random Forest SVM Naive Bayes 학습이 완료되면 Test and Score를 더블클릭해서 모델의 테스트 결과 즉 성능을 확인한다. Recall에서 마우스의 오른쪽 버튼을 눌러 LogLoss도 선택한다...

Orange3 지도학습 활용

코드와 수학 없이도 데이터과학, 통계, 머신러닝을 다룰 수 있도록 돕는 도구인 orange3를 이용해서 지도학습을 하는 방법 온도(독립변수)에 따른 판매량(종속변수)계산을 Orange3 구현 숫자형 데이터 회귀 보다 복잡한 것들도 모델로써 비교할 수 있다. 모델들끼리 경쟁을 시킨다. 범주형 데이터 분류 아이리스 꽃잎 데이터 모델비교

1DAY OT + 머신러닝

앞선 내용은 이미 올린 ai인공지능 ot내용과 동일. 데이터 과학과 공학은 정신과 육체의 관계와 비슷하다. ----------------------------------------------------------------------------------------------------------------------------------- 표 table ----------------------------------------------------------------------------------------------------------------------------------- [독립변수와 종속변수] 상관관계 -독립변수는 원인 종속변수는 결과이다. -둘의 관계를 인과관계라고 한다. -인과관계는 ..