분류 전체보기 (17) 썸네일형 리스트형 배깅[Bagging] Bagging 배깅(Bagging)이란 Bootstrap Aggregating이라 불리는 방법으로, 원본 훈련 데이터에서 여러 Bootstrap 샘플을 복원 방식으로 여러 번 뽑고 이렇게 뽑힌 여러 샘플 데이터들로 각 모델을 학습시키고 이렇게 학습된 여러 모델의 예측 결과를 집계(Aggregation)하는 앙상블(Ensemble) 학습의 한 방법이다. Classification 문제의 경우(혹은 Categorical Data)에는 학습된 다수의 모델이 분류한 결과 중 제일 많은 결정을 내린 쪽으로 선택하는 Voting 방식을 취하고, Regression 문제의 경우(혹은 Continuous Data)에는 도출된 결과들을 평균을 취하는 방식을 취한다. 배깅 방식은 높은 분산을 가진 학습 알고리즘의 안정성과.. [numpy] 넘파이 기초 Numpy Numerical Python의 약자 다양한 수학 연산과 다차원 데이터를 쉽게 다루기 위한 파이썬 라이브러리 Numpy는 ndarray라고 하는 특별한 객체를 사용 리스트와 달리 고정된 크기를 갖는다. 같은 타입의 데이터만 저장 가능. ndarray는 python 리스트에서 지원하지 않는 다양한 기능들을 지원 효율적으로 코드 작성 가능 더 빠른 속도 혹시나 데이터분석, 머신러닝, 딥러닝등을 조금이라도 다뤄보았다하면 한 번쯤 마주치는 녀석이 바로 이 Numpy 라는 녀석일 것이다. Numpy는 수학 및 과학 연산 등을 처리하기 위해 개발된 패키지로 다양한 행렬 연산 뿐 아니라 여러 간단한 통계, 수치해석 기능을 유용하다고 한다. Numpy import numpy는 파이썬에서 기본적으로 제공되는 .. [SQL] ER 다이어그램을 통한 관계 데이터베이스 설계 (RDBMS) ER 다이어그램을 작성하고 나면, 이를 통해 관계 데이터베이스를 설계해야 한다. 그 방법을 알아볼 것이다. 1. 정규 엔터티 타입의 사상 - ER 다이어그램의 엔티티 타입은 릴레이션으로 매핑한다. - 모든 단순 애트리뷰트를 포함시킨다. - 엔티티 타입의 키 중에서 하나를 릴레이션의 기본 키로 설정한다. 우선, ER 다이어그램 상의 엔티티를 확인해보자. ER 다이어그램의 표기법을 잘 모르는 사람도 있을 수 있기 때문에 사진을 하나 첨부하겠다. 위 사진에서 Entitiy는 테두리가 한 줄인 직사각형 하나로 표현될 수 있다. 여기서 테두리가 한 줄인 직사각형에 속하는 Entitiy는 EMPLOYEE DEPARTMENT PROJECT 이 세 가지이다. 위의 세 Entitiy를 릴레이션으로 매핑시킨 결과는 다음과.. [SQL] 조인(JOIN, INNER JOIN, OUTER JOIN) 조인 [JOIN] 조인은 두 개의 테이블을 서로 묶어서 하나의 결과를 만들어 내는 것을 의미한다. 조인에는 여러 종류의 조인이 있는데 세부적인 조인이 존재하지만 크게 두 가지로 나눌 수 있다. INNER JOIN (내부 조인) OUTER JOIN (외부 조인) INNER JOIN (내부 조인) INNER JOIN은 특정 컬럼을 기준으로 서로 매칭되는 튜플만 조인 결과에 포함된다. default 옵션으로 조인 조건을 만족하는 튜플들만 반환하게 되며, INNER 키워드를 생략할 수 있다. 위 그림처럼 A와 B 테이블의 교집합의 부분이 새로운 테이블의 결과로 나오게 된다. SELECT * FROM A INNER JOIN B ON A.number = B.number 위의 예시문처럼 FROM 절에 조인할 테이블의.. [SQLD] 47회 SQLD 합격 후기 거두절미하고 사진부터 올려본다. 매일 한 편씩은 블로그에 글 쓰자고 마음을 먹었었는데 거진 열흘이 되도록 안썼다. 핑계라면 핑계겠지만 요근래 너무 바빴고 지금도 바쁘지만 블로그 안써버릇 하다보면 다시 습관화 될 것 같아서 합격 후기라도 작성한다... 그렇다고 딱히 공부를 안하고 놀기만 한 것은 아니었는데 마냥 정리하고 블로그에 정리하기가 이리 귀찮을 줄이야 아무튼 각설하고, 47회 SQLD 시험에 기분 좋게 합격했다. 점수는 72 점 예상보다 못봐서 턱걸이로 합격할 것 같다고 생각했는데 항상 자격증 같은 시험들은 내 예상외로 점수가 나오더라. 그래도 학교 수업으로 데이터 베이스 수업을 듣고 시험을 쳤던지라 "데이터 모델링의 이해" 부분은 크게 공부를 하지 않았는데 과락 안당하고 잘 합격한듯 싶다. 만약,.. [Linux] gz 파일 압축 gz 파일을 압축 해제할 일이 생겨서 자료들을 찾아보았다. gzip 으로 압축하기 명령어 : gzip {압축 파일명} 예시 : gzip aaa.jpg 파일을 gz 형식으로 압축하고 싶을 땐 gzip 명령어를 사용한다, 별도의 옵션을 주지 않는다면 aaa.jpg 는 사라지고, aaa.gz 파일이 생성된다. # gz은 여러 개의 파일을 하나로 압축하는 용도가 아니다. 여러 개의 파일을 압축하려면 tar, zip, 7z 등의 압축을 사용하자. gz 압축 해제하기 gzip -d {압축 파일명}.gz gz 파일을 압축 해제 할 때는 -d 옵션을 주면된다. (-d는 decompress의 줄임말) # 만약 압축을 하거나 해제할 때 기존의 파일이 사라지는 걸 원치 않는다면, -k 옵션을 주도록 하자. gzip -k {.. [Python] 딕셔너리 파이썬의 딕셔너리는 키 - 값 구조로 이루어진 형태의 자료형을 말한다. 파이썬 3.7 + 이후 버전에서는 입력 순서가 유지되며, 내부적으로 해시 테이블로 구현되어 있다. ※ 해시 테이블 해시 테이블이란 해시함수를 사용하여 변환한 값을 색인(index)으로 삼아 키(key)와 데이터(value)를 저장하는 자료구조를 말한다. 인덱스를 숫자로만 지정할 수 있는 리스트와 달리 딕셔너리는 문자를 포함해 다양한 타입을 키로 사용할 수 있다. 특힌 파이썬의 딕셔너리는 해시할 수만 있다면 숫자, 문자, 집합까지 불변 객체들을 모두 키로 사용할 수 있다. 무엇보다 해시 테이블은 다양한 타입을 키로 지원하면서도 입력과 조회 모두 O(1) 에 가능하다. 연산 시간 복잡도 설명 len(a) O(1) 요소의 개수를 리턴한다... [Python] 리스트 리스트와 딕셔너리는 파이썬을 사용하다 보면 가장 빈번하게 접하게 되는 자료형이다 코딩 테스트 같은 문제 풀이 뿐만 아니라 pandas 같은 DataFrame의 형태도 리스트와 딕셔너리를 기반으로 돌아간다. 따라서 리스트와 딕셔너리의 기본 구조와 문법에 대해서 다시 한 번 숙지하려고 한다. 리스트 파이썬의 리스트(List)는 말 그대로 순서대로 저장하는 시퀀스이자 변경 가능한 목록을 말한다. 입력 순서가 유지되며, 내부적으로는 동적 배열로 구현되어 있다. 파이썬 리스트의 가장 좋은 점은 매우 다양한 기능을 제공한다는 점으로 리스트를 사용하면 사실상 스택을 사용할지 큐를 사용할지 고민하지 않아도 되며 스택과 큐에서 사용 가능한 모든 연산을 함께 제공한다. ※ 스택 : 한 쪽의 끝에서만 자료를 넣고 뺄 수 있.. 이전 1 2 3 다음