반응형
텍스트 문서중 엔터기호를 없애는 방법을 알아보겠습니다. 아래 사이트에서 엔터 부호를 없앨 수 잇는데요. https://removelinebreaks.net/ Remove Line Breaks Remove Line Breaks is a online text tool that automatically remove all abnormally inserted line breaks. removelinebreaks.net 텍스트를 직접 복사해서 넣거나, Upload file을 통해 파일을 업로드 할수도 있습니다. 엔터가 쳐진 글을 넣고 아래와 같이 하면 되는데요. 바로 빈칸이 없어진 것을 확인할 수 있습니다. 파이썬에서는 strip코드를 통해서도 제거할 수 있는데요. str1 = "\n Starbucks has t..
SQLD 자격증 공부를 하고 있습니다. 데이터 모델링이란? 현실세계를 일정한 표기법에 의해서 표기하는 것은 데이터 모델링이라고 합니다. 데이터 모델링은 단추명에 따라서 하게 되는데요. 단순화 : 필요한 기능만 선택, 쉽고 단순하게 표현 추상화 : 현실세계를 일정한 형식에 맞춰 표현 명확화 : 모호함을 제거하고 정확하게 표현 그리고 이러한 데이터 모델링에는 3단계 과정이 있는데요. 개논물이라고 합니다 개념적 구조 : 추상화 수준이 높고 포괄적 수준의 모델링 논리적 구조 : 데이터 정규화를 하며 데이터 모델링이 최종적 완료 물리적 구조 : 실제 DB의 물리적 성격(성능) 등을 고려하여 모델링 데이터 베이스의 3단계 구조 ANSI-SPARC에서는 데이터베이스를 쉽게 이해 및 사용할 수 있도록 3단계 데이터베이..
이번 시간에는 판다스의 정보를 변경해보는 방법을 알아보겠습니다. import pandas as pd data = {'name': ['kim', 'choi', 'park', 'lee', 'jung'], 'year': [2013, 2014, 2015, 2016, 2015], 'points': [2, 3, 5, 3, 4], 'id': ['0001', '0002', '0003', '0004', 'A0001']} df = pd.DataFrame(data) print(df) df.info() 먼저 기본 데이터를 입력하고 info를 통해서 타입을 확인해 봅니다. 이외에 정보를 확이하는 명령어는 df.describe()를 통해서 간단한 통계치를 확인할 수 있구요. df.shape를 통해서 형태에 대한 값도 불러올 수 ..
파이썬에서 폴더를 확인하는 명령어는 OS 패키지에 포함되어 있는데요. 먼저 테스트라는 폴더가 있는지 확인하는 방법은 아래의 exists 존재하는지와 isdir의 2가지 방법으로 확인이 가능한데요 전체 명령어는 파이썬 자습서에서 확인이 가능합니다. os.path — 일반적인 경로명 조작 — Python 3.10.6 문서 os.path — 일반적인 경로명 조작 Source code: Lib/posixpath.py (for POSIX) and Lib/ntpath.py (for Windows). This module implements some useful functions on pathnames. To read or write files see open(), and for accessing the filesy..
파이썬을 사용하다보면 판다스에서 특정조건을 찾아서 변경해야할 때가 있는데요. 예를 들어 아래와 같이 데이터를 만들어봅니다. import pandas as pd data = {'name':['choi','kim','lee','park'], 'grades':[90,80,70,60], 'result':['N/A','N/A','N/A','N/A']} df = pd.DataFrame(data,columns=['name','grades','result']) 실행을 하면 아래처럼 데이터가 잘 입력된 것을 알 수 있습니다. 이 때 90점이상이면 A를 result에 넣어보도록 하겠습니다. df.loc[조건, 변경할열] = 값의 순서로 넣어주시면 되는데요. 저는 grades열이 90이면 result열을 A가 되도록 짜보았..
저번 시간에 이어서 이번에는 셀레니움의 사용법중 중요한 headless에 대해서 알아보겠습니다. 2022.08.27 - [Programming/Python] - 파이썬 웹사이트 크롤링 하기 - 4. Selenium 사용하기 파이썬 웹사이트 크롤링 하기 - 4. Selenium 사용하기 이번 시간에는 이어서 셀레니움을 통해 크롤링 하는 방법을 알아보겠습니다. 셀레니움 준비하기 먼저 셀레니움을 쓰기 위해서는 크롬 드라이버를 다운받아야 합니다. 이 때 크롬 버전 확인이 remake.tistory.com Headless란? Headless 브라우저는 별도의 GUI 창이 뜨지 않고 사이트에 접속해서 페이지를 받는등의 작업을 실행할 수 있습니다. 즉 request로 접속하는것과 달리 selenium은 실제 크롬창이..