반응형
파이썬에서 날짜는 datetime 함수로 변환할 수 있습니다. Datetime datetime 오브젝트는 날짜(년,월,일)과 시각(시, 분, 초 마이크로초) 정보를 가진 오브젝트이다. 이러한 정보는 속성 year, month, day, hour, minute, second, microsecond 을 사용할 수 있다. dt_now = datetime.datetime.now() print(dt_now) Date date 오브젝트는 날짜(년, 월, 일) 의 정보를 가진 오브젝트이며 속성으로는 year, month, day가 있습니다. d_today = datetime.date.today() print(d_today) 그리고 크롤링을 한다면 날짜 형태가 다 달라서 고생하는데 이 때 사용하는 함수 두개가 있다. ..
Ubuntu에서 파이썬 가상환경을 설치하는 것을 따라해보겠습니다. 파이썬 가상환경 설치하기 가장 먼저 할 일은 파이썬과 가상환경 패키지를 설치하는 것입니다. 그리고 필요하다면 nodejs 등도 같이 설치해주면 좋은데요. git clone https://github.com/nvm-sh/nvm.git ~/.nvm cd ~/.nvm git switch -c v0.39.3 tags/v0.39.3 bashrc에 위치 등록하고 nano ~/.bashrc export NVM_DIR="$HOME/.nvm" [ -s "$NVM_DIR/nvm.sh" ] && \. "$NVM_DIR/nvm.sh" [ -s "$NVM_DIR/bash_completion" ] && \. "$NVM_DIR/bash_completion" node..
오늘은 구글 드라이브와 파이썬을 연동하는 방법을 알아보겠습니다. 그 중에서 구글 드라이브에서 기초 설정을 하는 방법을 알아보겠습니다. 구글 드라이브 연동하기 https://console.developers.google.com/projectselector2/apis/enableflow?apiid=drive&authuser=1&supportedpurview=project Google 클라우드 플랫폼 로그인 Google 클라우드 플랫폼으로 이동 accounts.google.com 구글 클라우드 플랫폼에서 회원가입을 하고 API를 신청합니다. 이 후 프로젝트 만들기를 통해 API 프로젝트를 생성합니다. 이후 프로젝트 이름을 원하는 것으로 만들어 줍니다. 이 후 구글 드라이브 API를 활성화 합니다. 필요시 Go..
파이썬 판다스에서 중복값을 찾는 방법을 알아보겠습니다. 업무를 진행하다보면 판다스를 활용해서 중복값을 찾아야하는 업무가 종종 있는데요. 판다스 중복값 찾기 판다스에서 중복값을 찾는 명령어는 duplicated인데요. subset을 활용하면 중복값을 찾고자하는 열을 선택할 수 있습니다. 이때 keep은 중복값 처리를 위한 값인데요. first는 처음것을 남기고, last는 마지막, false는 그냥 두는 것입니다. keep = 'first', 'last', False import pandas as pd data = {'name':['a', 'b', 'b', 'c', 'c'], 'id': ['aa' , 'aa', 'bb', 'cc', 'dd'], 'col':[1, 2, 3, 4, 5]} df = pd.Dat..
오늘은 파이썬에서 RSS feed 내에 있는 enclosures에 있는 첨부 파일을 일괄로 다운받는 방법을 알아보겠습니다. Rss enclosures RSS 인클로저는 음악 추천에 MP3 파일 또는 일기 항목에 사진과 같은 항목과 관련된 파일의 URL을 제공하여 멀티미디어 콘텐츠를 RSS 피드에 첨부하는 방법입니다. 전자 메일 첨부 파일과 달리 인클로저는 파일에 대한 하이퍼링크일 뿐이라고 합니다. 먼저 패키지는 rss를 읽을 feedparser, 그리고 ssl 우회를 위한 ssl 그리고 파일 다운로드를 위한 urllib.request가 필요합니다. 그리고 feedparser를 활용해서 rss를 불러오고 이 후에 rss 내용인 entries에서 enclosures 태그를 빼온 다음 href의 내용을 가져옵..
오늘은 판다스에서 기존 데이터에서 업데이트 된 증분만을 찾는 방법을 알아보겠습니다. 즉 차집합을 구하는 것인데요. 예를 들어 두개의 엑셀 파일에서 새로운 행만 변경하는 것을 코딩해보도록 하겠습니다. 먼저 폴더에서 xlsx로 된 파일을 찾습니다. 아래의 코드를 통해 file_list2라는 것에 엑셀 파일을 불러옵니다. 그리고 가장 최근의 파일과 [-1] 다음번의 파일인 [-2]를 불러옵니다 #파일 리스트 구하기 file_list1 = os.listdir(allDir) file_list2 = [file for file in file_list1 if file.endswith(".xlsx")] file_list2.sort() df1 = pd.read_excel(allDir+file_list2[-1]) df2 =..