새벽_나그네
12시 지난 새벽
새벽_나그네
전체 방문자
오늘
어제
  • 분류 전체보기
    • TIL
    • DevLog
    • Algorithm
    • ComputerScience
    • etc

블로그 메뉴

  • 홈
  • 태그
  • 방명록

공지사항

인기 글

태그

  • 국비지원
  • 내일배움카드
  • 내일배움캠프
  • 자기주도학습
  • 내일배움단
  • Github
  • Selenium 4
  • 프로그래머스
  • til
  • 개발일지
  • portfolio
  • docker
  • 코딩
  • 코린이
  • 스파르타코딩클럽
  • AI트랙
  • TodayILearned
  • 코딩프로젝트
  • machine learning
  • Python

최근 댓글

최근 글

티스토리

hELLO · Designed By 정상우.
새벽_나그네

12시 지난 새벽

TIL

2-4[Project] Orange bottle 크롤러

2022. 2. 4. 23:42

오늘 할 일 (계획)

1. AI 크롤링 시작하여 데이터 베이스에 추가하기

 

2. 포켓몬 얼굴상 프로젝트 자동 업데이트 설정 완료하기

 

오늘 한 일 (회고)

1. 크롤링 작업 완료 및 배포 완료 

- db.commit brake point 주의할 것 

delete = """
DELETE FROM test;
"""
cursor.execute(delete)

- 페이지 변경을 문자열 수정하는 방식으로 처리 가능

for p in range(1, page + 1):
    driver.get(
        "https://orangebottles.com/" + str(url) + "/?&page=" + str(p) + "&sort=like")
    print('페이지 전환')

작성한 코드 밑의 내용은 이전글의 aspx 형태의 사이트가 아님 

def main_scraper(category, category_name, id_num):
    i = 0
    for tr in category:
        i += 1
        id_num += 1
        try:
            img = tr.select_one('div:nth-child(' + str(i) + ') > div > div.item-thumbs > a > img')['data-original']
            title = tr.select_one('div:nth-child(' + str(i) + ') > div > div.item-detail > a > div > h2').text
            price = tr.select_one('div:nth-child(' + str(i) + ') > div > div.item-detail > a > div > div > p.pay').text
            description = tr.select_one('div:nth-child(' + str(i) + ') > div > div.item-detail > div.item-summary > p '
                                                                    '> span > strong > span').text
        except Exception as e:
            continue

        else:
            print("===================================" + str(i) + "==============================================")
            print('>>>>>>>>>>>>>>>>>>>>' + str(id_num) + '<<<<<<<<<<<<<<<<<')
            print(category_name)
            print(img)
            print(title)
            print(price)
            print(description)

            cursor.execute(
                f"INSERT INTO test VALUES('{id_num}','{category_name}','{img}','{title}','{price.strip()}','{description}')");

            db.commit()
    return id_num

orange bottle 사이트에 대한 내용 완료

 

내일 할 일

1. AI 크롤링 시작하여 데이터 베이스에 추가하기

 

2. 포켓몬 얼굴상 프로젝트 자동 업데이트 설정 완료하기

 

저작자표시 비영리 변경금지

'TIL' 카테고리의 다른 글

2-6[Project] Django를 이용한 검색기능  (0) 2022.02.06
2-5[Project] Django view와 Django 템플릿 문법  (0) 2022.02.06
2-3[Project] 정체 상태  (0) 2022.02.03
2-2[Project] SQL 쿼리문 연습  (0) 2022.02.02
2-1[Project] RDS : ERROR 2003 (HY000): Can't connect to MySQL server 해결  (0) 2022.02.01
    'TIL' 카테고리의 다른 글
    • 2-6[Project] Django를 이용한 검색기능
    • 2-5[Project] Django view와 Django 템플릿 문법
    • 2-3[Project] 정체 상태
    • 2-2[Project] SQL 쿼리문 연습
    새벽_나그네
    새벽_나그네
    IT, 프로그래밍, 정보, 스마트스토어

    티스토리툴바