Naver Ai Boostcamp 47

[DAY 11] 딥러닝 기초

📌 학습목표 베이즈정리란 무엇인가? 사전확률, 사후확률, evidence란 무엇인가 인과관계 추론의 경우, 조건부 확률을 어떻게 사용해야하는지 인과관계를 어떤 방식으로 사용할수 있는지 📌 조건부 확률 - 베이지안 통계는 조건부확률에서부터 시작하게 된다. \begin{align}P(A|B) = \frac{P(A\cap B)}{P(B)}\end{align} 사건 B가 일어났을 때, 사건 A도 발생할 확률을 의미한다. \begin{align*} P(A\cap B) &= P(B)P(A|B) \end{align*} 위와 같이 식을 수정할 수 있다. 📌 베이즈 정리 - 조건부 확률을 이용하여 정보를 갱신하는 방법을 알려준다. 데이터가 주어지기 전 이미 어느정도의 확률값(사전확률)을 예측하고 있을 때, 새로운 데이터..

Naver Ai Boostcamp 2021.02.02

[DAY 10] 시각화 / 통계학

matplotlob 맛보기 🙋‍♀️ 검색능력이 어마어마하게 중요하다 📌 그래프 그리기 fig = plt.figure() fig.set_size_inches(10, 10) # 싸이즈 설정 # plt.style.use("ggplot") # 스타일적용 ax = [] colors = ["b", "g", "r", "c", "m", "y", "k"] for i in range(1, 7): ax.append(fig.add_subplot(2, 3, i)) # 두개의 plot 생성 X_1 = np.arange(50) Y_1 = np.random.rand(50) c = colors[np.random.randint(1, len(colors))] ax[i - 1].plot(X_1, Y_1, c=c) - subplot(2,3)..

Naver Ai Boostcamp 2021.01.30

[DAY 9] Pandas II / 확률론

Pandas2 📌 Groupby split -> apply -> combine 인덱스(key)가 같은 데이터들끼리 쪼갠다. mean, sum 등의 함수를 적용한다. 합친다. df.groupby["Team"]["Points"].sum() #묶음의 기준이 되는 칼럼 # 적용받는 칼럼 # 적용받는 연산 # Team 컬럼에서 같은 값 끼리 묶어 points 컬럼 값을 합해준다. 묶음의 기준이 여러개가 될 수도 있다. (hierarchical index) -> index가 여러 개 생김 h_index = df.groupby(["Team", "Year"])["Points"].sum() h_index 인덱스가 Team, Year로 두 개 생긴 걸 확인할 수 있다. level 1 : Team , level 2 : Ye..

Naver Ai Boostcamp 2021.01.29

[DAY 8] Pandas I / 딥러닝 학습방법 이해하기

살다보면 가끔 그런 날이 있다. 평소에 자주 쓰던, 익히 알고있다고 생각하던 단어들이 갑자기 낯설어지는 그런 날 오늘이 딱 그랬다. 선형회귀, 등등 잘 알고있다고 생각했는데, 갑자기 이게 왜? 예시가 없나? 왜 이렇게 되지? 라는 의문이 계속 드는 그런 날이었다. Pandas 📌 Series dataframe 중 하나의 column에 해당하는 데이터의 모음 object numpy와의 가장 큰 차이점 : 인덱스 값을 지정해줄 수 있다. - default 값은 0부터 시작하는 숫자지만 따로 인덱스를 지정해줄 수 있다. value들의 데이터타입은 기본적으로 nd.array list_data = [1, 2, 3, 4, 5] example_obj = Series(data=list_data) example_obj ..

Naver Ai Boostcamp 2021.01.27

[DAY 7] 경사하강법

경사하강법 (순한 맛) 📌 미분 변수의 움직임에 따른 함수값의 변화를 측정하기 위한 도구 최적화에서 많이 사용하는 기법이다. 도함수 = 접선 -> x에서의 접선의 기울기 = 점 x에서의 미분 값 함숫값을 증가시키고싶다면 ? x ≔ x + f'(x) 함숫값을 감소시키고싶다면 ? x ≔ x - f'(x) x ≔ x + f'(x) : 미분값을 더하는 경사상승법 , 극댓값의 위치를 구할 때 사용 x ≔ x - f'(x) : 미분값을 빼면 경사하강법 , 극솟값의 위치를 구할 때 사용 우리의 목적은 "cost함수의 최소화" 그러므로 cost함수의 최솟값을 구하기 위해 경사하강법을 사용 극솟값을 어떻게 찾을까? (단편적인 2차원 cost함수라고 가정) 1. 우선 한 점 X를 찍는다. (initialize) 2. X에..

Naver Ai Boostcamp 2021.01.26

[DAY 6] Numpy / 벡터 / 행렬

numpy list에 비해 빠르고, 메모리 효율적 반복문 없이 데이터 배열에 대한 처리를 지원 C,C++ 등의 언어와 통합 가능 📌 ndarray np.array 함수를 활용해 배열을 생성 → ndarray 하나의 데이터 type만 배열에 넣을 수 있음 (C같이) List와 가장 큰 차이점 -> 다이나믹 타이핑 x (그래서 빠름 ) C의 Array를 사용하여 배열을 생성함 test_array = np.array(["1","4",5.0 ,8] , float) test_array >> array([1., 4., 5., 8.]) a = [1,2,3,4,5] b = [5,4,3,2,1] a[0] is b[4] >>True a = np.array(a) b = np.array(b) a[0] is b[4] >>Fal..

Naver Ai Boostcamp 2021.01.26