#1 흐름도 #2 학습 데이터 소스코드 123456789101112131415161718192021222324252627282930313233343536373839404142434445from sklearn import svm, metricsimport glob, os.path #1 file loadfiles = glob.glob("./lang/train/*.txt") #학습 데이터들을 모두 긁어옴 #학습 데이터와 레이블 리스트 변수를 생성.train_data = []train_label = [] for file_name in files: #레이블 구하기 basename = os.path.basename(file_name) lang = basename.split("-")[0] #텍스트 추출하기(안에 있는..
#1 데이터 가져오기 url : https://github.com/pandas-dev/pandas/blob/master/pandas/tests/data/iris.csv(csv파일을 저장하고 싶다면 RAW클릭 후 해당 내용을 전체 복사를 하고 메모장을 열어 복사한 내용을 붙여넣기 해서 다른이름으로 저장(iris.csv)를 해주면 됩니다.) #2 품종 분류 소스코드 1234567891011121314151617181920import pandas as pd #데이터를 읽어드리고 분할할때 편리from sklearn import svm, metrics"""svm : 데이터를 분류하는 최적(margin을ㅇ 최대화)선을 찾는 것을 의미.metrics : 정답률을 쉽게 구할 수 있게 됨."""csv = pd.read_..
#1 개발 PC 환경 - Windows 10 Professional 64bit- Python 3.6.4- Docker toolbox(최신버전)- Atom Edittor(Python package 설치) #2 전체 소스코드 1234567891011121314151617181920212223242526272829303132333435363738#모듈 추가import urllib.requestfrom bs4 import BeautifulSoupimport time #기사 목록 가져옴url = "http://news.naver.com/main/main.nhn?mode=LSD&mid=shm&sid1=105"response = urllib.request.urlopen(url) #응답 or 문자열 . html.pas..