오늘은 구글 드라이브와 파이썬을 연동하는 방법을 알아보겠습니다. 그 중에서 구글 드라이브에서 기초 설정을 하는 방법을 알아보겠습니다. 구글 드라이브 연동하기 https://console.developers.google.com/projectselector2/apis/enableflow?apiid=drive&authuser=1&supportedpurview=project Google 클라우드 플랫폼 로그인 Google 클라우드 플랫폼으로 이동 accounts.google.com 구글 클라우드 플랫폼에서 회원가입을 하고 API를 신청합니다. 이 후 프로젝트 만들기를 통해 API 프로젝트를 생성합니다. 이후 프로젝트 이름을 원하는 것으로 만들어 줍니다. 이 후 구글 드라이브 API를 활성화 합니다. 필요시 Go..
파이썬 판다스에서 중복값을 찾는 방법을 알아보겠습니다. 업무를 진행하다보면 판다스를 활용해서 중복값을 찾아야하는 업무가 종종 있는데요. 판다스 중복값 찾기 판다스에서 중복값을 찾는 명령어는 duplicated인데요. subset을 활용하면 중복값을 찾고자하는 열을 선택할 수 있습니다. 이때 keep은 중복값 처리를 위한 값인데요. first는 처음것을 남기고, last는 마지막, false는 그냥 두는 것입니다. keep = 'first', 'last', False import pandas as pd data = {'name':['a', 'b', 'b', 'c', 'c'], 'id': ['aa' , 'aa', 'bb', 'cc', 'dd'], 'col':[1, 2, 3, 4, 5]} df = pd.Dat..
오늘은 파이썬에서 RSS feed 내에 있는 enclosures에 있는 첨부 파일을 일괄로 다운받는 방법을 알아보겠습니다. Rss enclosures RSS 인클로저는 음악 추천에 MP3 파일 또는 일기 항목에 사진과 같은 항목과 관련된 파일의 URL을 제공하여 멀티미디어 콘텐츠를 RSS 피드에 첨부하는 방법입니다. 전자 메일 첨부 파일과 달리 인클로저는 파일에 대한 하이퍼링크일 뿐이라고 합니다. 먼저 패키지는 rss를 읽을 feedparser, 그리고 ssl 우회를 위한 ssl 그리고 파일 다운로드를 위한 urllib.request가 필요합니다. 그리고 feedparser를 활용해서 rss를 불러오고 이 후에 rss 내용인 entries에서 enclosures 태그를 빼온 다음 href의 내용을 가져옵..
오늘은 판다스에서 기존 데이터에서 업데이트 된 증분만을 찾는 방법을 알아보겠습니다. 즉 차집합을 구하는 것인데요. 예를 들어 두개의 엑셀 파일에서 새로운 행만 변경하는 것을 코딩해보도록 하겠습니다. 먼저 폴더에서 xlsx로 된 파일을 찾습니다. 아래의 코드를 통해 file_list2라는 것에 엑셀 파일을 불러옵니다. 그리고 가장 최근의 파일과 [-1] 다음번의 파일인 [-2]를 불러옵니다 #파일 리스트 구하기 file_list1 = os.listdir(allDir) file_list2 = [file for file in file_list1 if file.endswith(".xlsx")] file_list2.sort() df1 = pd.read_excel(allDir+file_list2[-1]) df2 =..
파이썬 코드 작성중 'Couldn't find a tree builder with the features you requested: lxml. Do you need to install a parser library?' 라는 메시지를 만나게 되는데요. 이는 말그대로 lxml이 패키지가 설치되지 않은 것인데요 ======================================== RESTART: C:/pyfile/cr_add_1.py ======================================= Traceback (most recent call last): File "C:/pyfile/cr_add_1.py", line 1, in import feedparser ModuleNotFoundError:..
파이썬 작업 중 아래와 같은 에러가 발생했습니다. Traceback (most recent call last): File "C:/python/qrcode1.py", line 2, in from PIL import Image ModuleNotFoundError: No module named 'PIL' 에러의 원인은 이미지 처리인 PIL 모듈이 없는것인데요. pip install PIL로는 설치가 되지 않았습니다. PIL? Python Imaging Library은 파이썬 인터프리터에 다양한 이미지 파일 형식을 지원하고 강력한 이미지 처리와 그래픽 기능을 제공하는 자유-오픈 소스 소프트웨어 라이브러리이다. 줄여서 PIL이라고 부른다. 윈도우와 맥 오에스 엑스, 리눅스를 지원합니다. https://pypi.o..