반응형

전체 글 103

[Python algo] 중앙값 계산 | 중앙값 사용

안녕하세요. 이승혁 입니다. 오늘은 데이터의 중앙값을 구현해 보도록 하겠습니다. 중앙값이 무엇이고 언제 사용해야 하는지는 공부를 마쳤습니다. 중앙값에 대한 정보가 필요하신 분들은 아래 포스팅을 참고하시면 될 것 같습니다. 2021/01/06 - [데이터 분석] - [데이터 분석] 대푯값 | 평균 , 중앙값 , 최빈값 [데이터 분석] 대푯값 | 평균 , 중앙값 , 최빈값 데이터를 분석하는 과정 중 데이터 탐색은 매우 중요한 과정입니다. 한 집단의 특성을 수치로 나타내는 대표값들을 사용해 데이터를 살펴보는 순서는 다음과 같습니다. 평균 ---> 중앙값 ---> 최 lsh-story.tistory.com ## 중앙값 ? 데이터를 순차적으로 나열 , 가장 가운데에 있는 값입니다. 이상치에 대한 영향이 적습니다...

알고리즘 2021.01.20

[Python algo] 탐욕 알고리즘 | Greedy algorithm

안녕하세요 오늘은 탐욕 알고리즘이란 무엇인가 알아보고 , 이를 간단하게 구현해 보도록 하겠습니다. ### 탐욕 알고리즘(Greedy algorithm) ? 탐욕 알고리즘은 최적의 해를 구하는 방법입니다. 현재 상황에서 가장 좋다고 생각하는 것을 선택해 나가는 방식입니다. 또한, 이러한 선택 방법이 가장 좋을 것이라고 기대하고 사용하는 것입니다. 문제를 해결하는 과정에서 순간순간마다 최적의 결정하는 방식 하지만 항상 최적의 답을 구해주지는 않습니다. 예시로 다음 과정을 확인하시면 됩니다. step 1 : 1에서 시작 step 2 : 7 / 9 선택 -> 탐욕 알고리즘 , 9 선택 step 3 : 11 / 15 선택 -> 탐욕 알고리즘 , 15 선택 1 + 9 + 15 = 25 탐욕 알고리즘을 통해 25라는..

알고리즘 2021.01.19

[Python&SQL] 치환문자를 통해 피타고라스 정리 구현

안녕하세요! 오늘은 피타고라스 정리를 사용해 직각 삼각형을 판단해주는 방법을 알아보겠습니다. SQL , Python을 통해 구현해보도록 하겠습니다. ## 피타고라스 정리 ? 임의 직각 삼각형에서 밑변(a), 높이(b), 빗변(c)이라고 할 때 , 밑변과 높이의 각 제곱의 합은 빗변의 제곱과 같다. # 피타고라스 정리 증명 증명에는 여러가지 수학적 이론들이 많이 필요한 것을 찾게 되었습니다. 피타고라스 정리는 평면 기하에서 가장 의미있는 정리 중 하나라고 합니다. 300 여 개가 넘는 증명이 알려져 있다고 합니다. 유도되는 공식 중 코사인 제 2 법칙을 사용해서 피타고라스 정리를 확인해 보도록 하겠습니다. # 알고리즘 1. 밑변 , 높이, 빗변의 길이를 입력 받습니다. 2. 이를 위 공식을 사용해 값을 판..

알고리즘 2021.01.18

[Tensorflow] 1.x ver 연산 | 그래프 그리기 | 실행

안녕하세요 이승혁입니다! 지난 포스팅에서 텐서플로우에 대해 간단하게 ? 알아볼 수 있었습니다! 2021/01/15 - [딥러닝/Tensorflow] - [Tensorflow] Tensor ? Tensorflow ? [Tensorflow] Tensor ? Tensorflow ? ## Tensor ? 딥러닝에서 데이터를 표현하는 일반적인 방법입니다. 행렬로 표현할 수 있는 2차원 테이블 -> 높은 차원으로 확장합니다. 다차원 배열 # 이미지 RGB = Red, Green, Blue 에 대한 세 가지 값으로 lsh-story.tistory.com 이번 시간에는 텐서플로우의 연산을 실습해 보도록 하겠습니다! 텐서플로의 연산 그래프는 어떤 연산을 할 지 정의한 후 외부 매커니즘을 통해 그 연산을 실행시키는 구조입..

[Tensorflow] Tensor ? Tensorflow ?

## Tensor ? 딥러닝에서 데이터를 표현하는 일반적인 방법입니다. 행렬로 표현할 수 있는 2차원 테이블 -> 높은 차원으로 확장합니다. 다차원 배열 # 이미지 RGB = Red, Green, Blue 에 대한 세 가지 값으로 나타냅니다. 이를 텐서(3차원 값을 가지는 배열)로 나타낼 수 있습니다. ## Tensorflow? 데이터(Tensor) 흐름 그래프를 기반으로 하는 SW 프레임 워크입니다. 머신러닝 알고리즘 중 심층 신경망(Deep Neural Network)을 구현하기 위한 인터페이스가 주 목적입니다. 그래프를 구성하는 부분과, 그래프를 실행하는 부분으로 구성됩니다. 이식성 : 연산 그래프를 다양한 환경, 하드웨어 플랫폼에서 실행 가능 동일 코드 사용해 여러 컴퓨터 클러스터상 분산 처리 신..

[Python&SQL] 각 자리수 합 더하기

안녕하세요. 이승혁입니다. 파이썬과 Oracle SQL을 사용해 각 자리수의 합을 구해보도록 하겠습니다. 간단하게 구현할 수 있는 알고리즘으로 , 여러 방법으로 구현이 가능합니다. ## 각 자리수 출력하기 파이썬에선 슬라이싱 , SQL에서는 substr 함수가 있었습니다. 파이썬의 len 함수, SQL의 length 함수를 구하면 문자의 길이를 구할 수 있습니다. 이것만 알면 알고리즘은 벌써 머리속에 구현이 되었다고 생각합니다. ### Python 각자리수 합 구하기 데이터는 문자형인 경우가 많습니다. 따라서 실습 데이터도 문자형으로 사용하겠습니다. for문과 len함수를 사용해 데이터를 출력해 봅니다. data='1024' for i in range(len(data)): print(data[i]) 이제..

알고리즘 2021.01.15

[Python&SQL] 적어도 불량품 1개일 확률 ?

한 상자에 6개의 물건이 들어있다. 그 중 2개가 불량품입니다. 3개를 추출했을 때 적어도 1개의 불량품이 발견될 확률은 ? 어렸을 때 수학 시간에 많이 다루어 보았던 문제입니다. 적어도 1개 확률 = 1 - 모두 아닐 확률 공식으로 구했던 것 같습니다. 다시 알아보도록 하겠습니다. ## 베르누이 / 베르누이 확률 ? # 베르누이 시행 실험 / 관찰의 결과로 발생 가능한 사상이 단 두가지인 경우 ex) 실패 or 성공 / 정상 or 비정상 / 양품 or 불량품 # 베르누이 시행 조건 1. 시행 결과를 확률변수 X , X = 0 or 1 1은 사상의 성공 , 0은 사상의 실패로 흔히 사용합니다. 2. 각 실험에서 성공할 확률은 p, 실패할 확률은 1-p로 일정합니다. 성공 확률과 실패 확률의 합은 1입니다..

알고리즘 2021.01.14

[Python Error] Matplotlib 한글 폰트 오류

Oracle SQL Matplotlib는 한글 폰트를 지원하지 않습니다. 한글로 출력되어야 하는 부분은 네모 박스로 표시되게 됩니다. Matplotlib를 사용하는 파이썬 프로그램의 앞에 한글 폰트를 지정하는 코드를 추가합니다. 다음 알집 파일을 해제하면 한글 폰트가 있습니다. from matplotlib import font_manager,rc font_path="d:\\판다스 실습\\korean.ttf" font_name=font_manager.FontProperties(fname=font_path).get_name() rc('font',family=font_name) 위 코드를 실행시킵니다. 다시 그래프를 그려보면 한글이 정상적으로 출력됩니다. ### MAC OS 한글 폰트 맥 os 한글 폰트 오류..

[Pandas] 데이터 시각화 | Matplotlib | 그래프 꾸미기

Oracle SQL 데이터 분석에서 다루는 데이터의 종류는 매우 다양합니다. 따라서 다양한 종류에 따라 알맞은 시각화 방법을 알아야 합니다. Matplotlib 모듈은 평면 그래프에 대한 다양한 포맷, 시각화 기능을 제공합니다. # 선 그래프 import pandas as pd import matplotlib.pyplot as plt ## 데이터 전처리 df=pd.read_excel('d:\\판다스 실습\\인구수데이터.xlsx') df.fillna(method='ffill',inplace=True) mask=(df['전출지별']=='서울특별시') &(df['전입지별']!='서울특별시') df2=df[mask] df2.drop('전출지별',axis=1,inplace=True) df2.rename({'전입지..

[Python & SQL] 몬테 카를로 | 원주율 구하기

안녕하세요. 이승혁입니다. 오늘은 몬테 카를로 방법(Monte Carlo method)을 사용해 원주율(3.14......)을 구해보도록 하겠습니다. ### 몬테 카를로 방법(Monte Carlo method) ? 난수를 생성해 함수의 값을 확률적으로 계산하는 방법 계산하려는 값이 닫힌 형식으로 표현되지 않거나 복잡한 경우에 근사적으로 계산할 때 사용됩니다. 원주율과 같이 딱 하나의 값으로 수렴하지 않는 경우에 사용합니다. ## 원 그리기 반지름 r, 중심이 (a, b) 인 원의 방정식은 (x - a)2 + (y - b)2 = r2 입니다. 반지름 1 , 중심 (0,0) 인 원의 식은 어떻게 될까요 ? x^2 + y^2 = 1 파이썬으로 그려서 확인해 보도록 하겠습니다. import matplotlib...

알고리즘 2021.01.09

[동탄 맛집] 한여사등갈비앤함흥냉면 | 동탄 갈비탕 | 사태탕 | 함흥냉면

안녕하세요!! 오늘은 정말 맛있게 먹은 숨은 맛집을 소개해드리겠습니다. " 경기도 화성 동탄 " " 한여사 등갈비 앤 함흥냉면 " 무더운 여름엔 시원한 " 함흥 냉면 " 요즘같이 쌀쌀한 날씨엔 따뜻한 " 갈비탕 " 1년 내내 즐길 수 있는 맛집입니다!! 내돈내산은 아니고 엄돈엄산입니다. 저희 어머니가 사주셨습니다. 전날 과음 후 해장으로 함흥 냉면 먹으러 자주 가던 가게였는데 어느날부터 갈비탕, 사태탕 등 다양한 메뉴가 추가됐더라구요!! 메뉴가 엄청 다양하죠 ? 떡갈비도 정말 맛있더라구요 제가 해장하면서 찍었던 사진입니다 ㅎㅎ 급하게 먹느라 인증용으로 한 장 밖에 남은게 없네요 그리고 몇 일 전 새로운 메뉴를 포장해 봤습니다! 갈비탕 / 사태탕 / 우거지 갈비탕 총 세 가지 메뉴를 포장해 왔고 모두 성공..

맛집 2021.01.08

[Python] 없는 수가 뭘까 ? 빠진수 찾기

1 2 3 4 5 6 8 9 10 " 다음 중 빠진 수는 무엇일까요 ? " 7 작은 범위이기에 눈으로 금방 파악 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 26 27 28 29 30 그럼 조금 더 많은 30개 입니다. 벌써 보기가 싫어졌습니다. 심지어 정렬이 잘 되어 있어서 확인하기 더 편합니다. 실제 데이터는 ? 훨씬 큰 데이터 정렬 되지 않은 데이터 지저분한 데이터 우리가 다룰 데이터는 예쁘고 깔끔하지 않습니다. 다양한 데이터를 만지는 연습을 하는 것이 좋다고 생각합니다. ### Python 빠진 수 찾기 데이터 : [ 1, 2, 3, 4, 5, 6, 8 , 9, 10] 해당 범위에서 빠진 번호를 찾는 알고리즘을 구현해 보도록 하겠..

알고리즘 2021.01.07

[Pandas] 데이터 시각화 | 판다스 내장 그래프

안녕하세요 이승혁입니다. 오늘은 판다스의 내장 그래프를 이용해 데이터를 시각화 하겠습니다. 데이터를 분석해보면서 시각화가 정말 중요하단 것을 느꼈습니다. 내가 이해하기에도, 남을 이해시키기에도 가장 좋은 방법이었습니다. 데이터를 간략하고 예쁘게 시각화 할 수 있는 능력은 데이터 분석가에게 필수라고 생각합니다. ## 판다스 내장 그래프 판다스는 데이터를 시각화 하는 라이브러리인 Matplotlib의 기능을 일부분 내장하고 있습니다. 별도로 import 하지 않아도 간단하게 데이터를 그래프로 표현할 수 있습니다. Option 종류 Option 종류 'line' 선 그래프 'kde' 커널 밀도 그래프 'bar' 막대 그래프 - 수직 'area' 면적 그래프 'barh' 막대 그래프 - 수평 'pie' 원형 그..

[데이터 분석] 대푯값 | 평균 , 중앙값 , 최빈값

데이터를 분석하는 과정 중 데이터 탐색은 매우 중요한 과정입니다. 한 집단의 특성을 수치로 나타내는 대표값들을 사용해 데이터를 살펴보는 순서는 다음과 같습니다. 평균 ---> 중앙값 ---> 최빈값 ---> 범위 ---> 사분위수범위 ---> 분산 ---> 표준편차 대표값을 제대로 활용하기 위해서는 값들에 대한 충분한 이해가 필요합니다. 수치 사용 이유 수치 사용 시기 수치의 의미 여러 가지 상황에서 적절한 수치를 사용할 줄 알아야 합니다. ### 평균 # 산술 평균 데이터의 합/데이터 개수 조사 대상의 값을 모두 더해 대상의 수로 나누는 방식입니다. 큰 값에서 작은 값으로 이동하여 전체적으로 공평하게 분배했을 때의 양이다. 사용 : 데이터의 평균적인 수치를 확인할 때 사용 단점 : 이상치가 있는 경우 ..

데이터 분석 2021.01.06

Pandas - 통계 함수 max min corr

산술 데이터를 갖는 DataFrame의 열에 통계 함수를 적용해 결과를 확인합니다. 특정 열에 적용할 수 있습니다. # mean - 평균값 산술 데이터를 갖는 각 열에 대한 평균값을 시리즈 객체로 반환 # median - 중앙값 데이터의 모든 열의 중앙값을 시리즈 객체로 반환 # max , min - 최대값 , 최소값 각 열 데이터의 최대값과 최소값을 반환 # std - 표준 편차 각 열 데이터의 1 표준 편차 값을 시리즈 객체로 반환합니다. 스칼라 값인 경우 float 유형으로 반환합니다. # corr - 상관계수 두 열 간의 상관계수를 반환합니다. 상관 계수의 범위는 -1

[Python] 주사위 던지기

안녕하세요. 이승혁 입니다. 지난 포스팅에서 동전의 앞면, 뒷면에 대한 확률을 확인해 봤습니다. 이전 게시글을 읽고 오시면 생략한 부분들에 대한 설명이 나와있습니다. 2021/01/04 - [알고리즘] - [Python&SQL] 동전의 앞면이 나올 확률은 ? Random [Python&SQL] 동전의 앞면이 나올 확률은 ? Random 동전을 던졌을 때 앞면이 나올 확률은 어떻게 될까요? 숫자를 사용해서 확률을 구해보겠습니다. 0 : 동전의 뒷면 1 : 동전의 앞면 0 , 1 중 랜덤으로 하나를 선택할 확률은 동전을 던졌을 때 앞면과 lsh-story.tistory.com 오늘은 주사위를 사용해 확률을 확인해 보도록 하겠습니다! # 주사위 1회 던지기 import random print('주사위를 던집니..

알고리즘 2021.01.05

[Python Error] ImportError: No module named 'win32api'

텐서플로우 실습을 위해서 가상환경을 새로 생성했습니다. 필요한 모듈 설치 후 쥬피터 노트북을 실행했습니다. kernel dead 표시와 함께 다음 에러가 발생했습니다. # ImportError: No module named 'win32api' 해결 : pypiwin32 설치 anaconda prompt 실행 -> actiave 실행 환경 -> pip install pypiwin32 -> 쥬피터 노트북 정상적으로 쥬피터 노트북을 사용할 수 있습니다.

반응형
반응형