SSONG Cloud
머신러닝기반 빅데이터 응용 전문가과정 - 4 본문
(2020.07.06)
인터프리터 언어란 프로그래밍 언어의 소스 코드를 바로 실행하는 컴퓨터 프로그램이다. 그리고 구글이나 인스타그램, 드롭박스 등에 사용되고, 초보자가 배우기 쉽고 다양한 라이브러리 및 툴을 가지고 있으며 머신러닝 인공지능 밑 데이터 과학 라이브러리와 프레임워크를 활용할 수 있다. 따라서 파이썬을 필요로하는 기업의 수요가 증가하고 있다.
파이썬이 할 수 있는 일과 없는 일을 나누어 보면 먼저 할 수 있는 일로는 시스템 유틸리티 제작
GUI프로그래밍 C/C++ 언어와의 결합, 웹 프로그래밍, 데이터 베이스 프로그래밍
데이터 분석이 있다. 반면 파이썬이 할 수 없는 일로는 시스템과 밀접한 프로그래밍영역과 모바일 프로그래밍이 있다.
또한 파이썬 패키지와 에디터가 필요한데 이를 한번에 제공해 주는 플랫폼인 아나콘다를 사용할 수 있다.
이 아나콘다는 파이썬을 활용한 데이터 분석, 어플리케이션 개발에 도움을 주는 플랫폼이다.
아나콘다를 통해 주피터 노트북을 사용할 수 있다. 주피터 노트북은 커맨드 모드와 에디트 모드 두가지 모드로 나눠지고, 커맨드 모드에서 사용할 수 있는 단축키는 다음과 같다.
a : 위에 셀 추가
b: 아래에 셀 추가
m: markdown으로 전환(마크다운은 약간 주석같은 느낌이다.)
c: code로 전환
dd: 셀 삭제
에디트 모드에서 사용할 수 있는 단축키는 다음과 같다.
esc: conmmand mode로 전환
ctrl + z: 되돌리기
ctrl + y: 앞으로 되돌리기
공통 단축키로는
ctrl + enter: 셀 실행
alt + enter : 셀 실행 후 아래에 셀 추가
shift + enter: 셀 실행 후 아래로 커서 이동
다음으로는 변수에 대해 배웠다. 다른 프로그래밍에서 사용되는 의미와 동일하게 저장공간을 의미한다.
또한 파이썬의 자료형 종류로는 숫자(정수), 숫자(실수), 문자열, 논리가 있다.
파이썬에서 문자열은 홑따옴표나 쌍따옴표로 표현한다. 또한 문자열에서 문자로서의 홑따옴표나 쌍따옴표를 표현하고자 한다면 이스케이프 코드로 역슬래쉬를 앞에 달아 표현하거나 아니면 전체 따옴표와 표현하고자 하는 따옴표를 달리하여 표현가능하다. 이스케이프 코드는 프로그래밍 할 때 사용할 수 있도록 미리 정의해둔 문자 조합으로 다음과 같은 것들이 있다.
\n 개행
\t 수평탭
\\ 문자 "\"
\' 단일 인용부호(')
\" 이중 인용부호(")
또한 이외에도 따옴표 3쌍을 연속으로 써서 문자열의 양쪽을 둘러싸서 표현 한다면 그 안에서는 개행이든 탭이든 이스케이프 코드 없이도 원하는 대로 표현할 수 있다.
그 다음으로는 문자열 인덱싱과 슬라이싱을 배웠다. 둘다 문자열을 자르는 것인데
인덱싱은 한 문자씩 자르는 것이고 슬라이싱은 일정 구간을 자르는 것이다. 특히 두개의 함수 모두 문자열의 인덱스를 통해 접근하는데 이는 0부터 시작하며 뒤에서 부터 시작할 경우 -1부터 시작한다.
또한 슬라이싱의 경우 [:]로 인덱스 구간을 나타내면 문자열 전체를 의미하고 맨 앞과 맨 뒤는 인덱스 지정없이 표현 가능하다.
문자열 포매팅은 문자열 안의 특정한 값을 바꿔야 할 경우 사용하는데 %와 format을 통해 사용 가능하다.
먼저 %을 사용하는 경우에는 문자열 안에서 바꾸고자할 값의 자료형에 맞춰 포맷코드를 삽입해야 한다.
포맷 코드는 다음과 같다.
%s 문자열
%c 문자1개
%d 정수(integer)
%f 실수(float point)
%% Literal %(문자"%"자체)
또한 format을 사용할 경우 문자열 안에서 바꾸고자하는 값의 자리에 {}를 삽입하고 문자열이 끝난 후 .format(값) 을 붙여서 사용한다. 예를 들면 "오늘은 7월 {}입니다.".format(day)로 사용가능하다.
그 후 문자열과 관련된 부가적인 함수들을 배울 수 있었다. 그 내용은 다음과 같다.
count("문자") : 문자열에 포함된 문자 개수 세기
find("문자") : 문자 위치 알려주기
index("문자") : 문자 위치 알려주기
join("문자") : 각각의 문자 사이에 "문자" 삽입하기
replace("문자1", "문자2") : 문자열 1을 문자열2로 바꾸기
split("기준이 되는 문자") : 기준이 되는 문자로 문자열 나누기
가 있다.
특히 여기서 find와 index는 둘다 문자의 위치를 알려주지만 만약 입력으로 넣은 문자가 문자열에 존재하지 않는다면 find는 -1을 반환하지만 index를 반환한다는 것이다.
'Machine Learning > 머신러닝기반 빅데이터 응용 전문가과정' 카테고리의 다른 글
머신러닝기반 빅데이터 응용 전문가과정 - 6 (0) | 2021.04.12 |
---|---|
머신러닝기반 빅데이터 응용 전문가과정 - 5 (0) | 2021.04.12 |
머신러닝기반 빅데이터 응용 전문가과정 - 3 (0) | 2021.04.12 |
머신러닝기반 빅데이터 응용 전문가과정 - 2 (0) | 2021.04.12 |
머신러닝기반 빅데이터 응용 전문가과정 - 1 (0) | 2021.04.12 |