목록데이터 엔지니어링 정복 (376)
지구정복
![](http://i1.daumcdn.net/thumb/C150x150/?fname=https://blog.kakaocdn.net/dn/x8hRu/btrdJ3LhIlm/bmpHBONeUis9Q5YIkWF4J0/img.png)
출처: 빅데이터를 지탱하는 기술 책에 나와있는 코드가 실행이 안되서 제가 약간 수정을 했습니다~ 책에 나온 예제 데이터는 더 이상 다운로드할 수 없길래 비슷한 웹서버 로그를 찾아서 진행했다. 아래에서 다운로드 받을 수 있다. *운영환경 윈도우10 파이썬3.8.5 IDE: 이클립스pydev 1. 로그 데이터 파싱하기 해당 로그 데이터에서 필요한 부분만 정규표현식을 이용해서 추출하고 이를 pandas를 이용해서 데이터프레임 형식으로 만들어본다. import re import pandas as pd import os.path #로그 데이터를 확인하고 추출하고 싶은 데이터만 정규표현식을 이용해서 추출 #시간, 웹서버요청정보, 요청결과, 크기 pattern = re.compile( '^\S+ \S+ \S+ \[(..
https://www.acmicpc.net/problem/18290 18290번: NM과 K (1) 크기가 N×M인 격자판의 각 칸에 정수가 하나씩 들어있다. 이 격자판에서 칸 K개를 선택할 것이고, 선택한 칸에 들어있는 수를 모두 더한 값의 최댓값을 구하려고 한다. 단, 선택한 두 칸이 인접 www.acmicpc.net -문제해설 일단 아이디어는 간단하다. main메서드에서 n m k값 입력받고 좌표값 입력받아서 arr 배열에 넣어준다. 그리고 visit 배열도 만들어준다. 이는 방문처리를 위한 배열이다. findMax( int depth ) 메서드를 호출한다. findMax 메서드에서는 좌표를 (0, 0)에서 (n-1, m-1) 순회한다. 순회하는 값을 행은 i, 열은 j라고 하자. 이때 i, j의 ..
https://www.acmicpc.net/problem/15657 15657번: N과 M (8) N개의 자연수와 자연수 M이 주어졌을 때, 아래 조건을 만족하는 길이가 M인 수열을 모두 구하는 프로그램을 작성하시오. N개의 자연수는 모두 다른 수이다. N개의 자연수 중에서 M개를 고른 수열 www.acmicpc.net -문제해설 갑자기 해설쓰는게 귀찮다.... 미래의 내가 안틀리고 잘 풀 수 있겠지...? 미래의 나 파이팅~ -자바 package bruteforce; import java.io.BufferedReader; import java.io.IOException; import java.io.InputStreamReader; import java.util.Arrays; import java.uti..
![](http://i1.daumcdn.net/thumb/C150x150/?fname=https://blog.kakaocdn.net/dn/bEgLuu/btrdERKclHZ/0pOGNUQbZeBkeOMm0lw7RK/img.png)
numpy 모듈 사용하려는데 아래와 같은 에러가 떴다.. * the python vhttps://numpy.org/devdocs/user/troubleshooting-importerror.htmlrsion is: python3.8 from "" * the numpy version is: "1.19.2" 대충 보니깐 파이썬 3.8.5에서 numpy 1.92.2를 사용하지 못하는 것 같았다. 파이썬 버전을 올리거나 numpy버전을 낮춰서 사용해야하는데 파이썬 버전 올리는 건 귀찮아서 numpy버전을 낮췄다. 아나콘다 파이썬 인터프리터이면 아나콘다 프롬프트를 실행 그냥 파이썬 인터프리터이면 cmd창 실행해서 아래 명령어로 현재 numpy 삭제한다. pip uninstall numpy 이제 numpy모듈을 설치..