20210122 오늘공부: Numpy 기본함수 다루기

티스토리 뷰

공부/Python

eℓlie 2021. 1. 23. 01:36

import numpy as np

⊙ Boolean 값으로 선택하기

중복된 이름이 포함된 배열 names가 있다.

numpy.random 모듈의 .randn 함수를 사용해 임의의 표준정규분포데이터를 생성한다.

각 이름이 data 배열의 row에 대응한다고 가정하자.

names = np.array(['Bob', 'Joe', 'Will', 'Joe', 'Bob', 'Will', 'Joe'])
data = np.random.randn(7, 4)

만약 전체 row에서 'Bob'과 같은 이름을 선택하려 할 때 산술 연산과 마찬가지로 배열에 대한 비교 연산도 벡터화되므로 names를 'Bob' 문자열과 비교하면 Boolean 배열을 반환한다.

names == 'Bob'

쉽게 말해 'Bob'이면 True, 아니면 False를 반환한다는 뜻이다.

그래서 이 Boolean 배열은 색인으로 활용할 수 있다.

data[names == 'Bob']

다만 Boolean 배열의 길이는 색인하려는 축의 길이와 같아야 한다.

한편 != 연산자나 ~로 Bob이 아닌 친구들만 골라낼 수도 있을 것이다.

names != 'Bob'
data[~(names == 'Bob')]
cond = names == 'Bob'
data[~cond]

& 또는 | 과 같은 논리연산자를 사용해서 두 개 이상의 조건을 설정할 수도 있다.

mask == (names == 'Bob') | (names == 'Will')
mask
data[mask]

배열에 Boolean 색인을 적용해 데이터를 선택하면 반환되는 배열의 내용이 바뀌지 않더라도 항상 데이터 복사가 발생한다.

어쨌든 2차원 데이터에 대한 이런 연산은 pandas를 활용하는 것이 조금 더 편하다.

알고리즘 문제 풀 때 조건을 잘 읽어야 하는 이유(+공부 근황) (0)	2022.08.07
네이버 부스트코스 '모두를 위한 파이썬' 스터디 참여! (1)	2022.07.11
20210121 오늘공부: Numpy 기본함수 다루기 (0)	2021.01.21
파이썬 핵심함수(기본함수, 수집, 처리) #2 BeautifulSoup을 이용한 html 파싱 기본 (0)	2020.12.21
20201221 오늘의 공부 (0)	2020.12.21

공지사항

최근에 올라온 글

최근에 달린 댓글

링크

글 보관함

내 블로그 - 관리자 홈 전환	`Q` `Q`
새 글 쓰기	`W` `W`

글 수정 (권한 있는 경우)	`E` `E`
댓글 영역으로 이동	`C` `C`