본문 바로가기

분류 전체보기47

2. 도커 와 쿠버네티스 ? 도커(Docker)란? 도커는 컨테이너 기반의 오픈소스 가상화 플랫폼 이며, 컨테이너를 기반으로 VM의 Guest OS와 Hypervisor를 Docker engine으로 대체하는 기술입니다. 도커를 사용하는 이유? 도커 컨테이너는 이전의 방법보다 더 쉽게 조립, 유지관리, 이동시킬 수 있는 애플리케이션 제작 방법을 제공한다. 컨테이너는 경량이기 떄문에 컨테이너가 늘어나도 VM을 사용할 때보다 효율적이다. 쿠버네티스(Kubernetes)? 쿠버네티스는 도커의 한 종류 이며, Linux 컨테이너 작업을 자동화하는 오픈소스 플랫폼을 뜻하며, 약어로는 k8s라고도 불린다. 2022. 3. 9.
1. 컨테이너란? 컨테이너(Container)? 호스트 OS상에서 논리적인 구획(컨테이너)를 만들어, 어플리케이션을 작동시키기 위해 필요한 라이브러리나 어플리케이션등을 하나로 모아 별도의 서버인 것처럼 사용할 수 있게 만드는 것 이다. 컨테이너 VS 가상머신(VM) 1. 가상머신 (VM) 가상머신 VM은 Host OS(메인 운영체제) 위에 Hypervisor를 사용합니다. Hypervisor ? : 단일 하드웨어에서 여러 가상 머신들을 호스팅 할 수 있게하는 프로그램입니다. Hypervisor 위에 Guest OS를 구동하여 그 위에 각기 다른 운영체제가 필요한 프로그램등을 구동 할 수 있습니다. A. 가상머신의 장점? 가상 머신은 Guest OS를 사용하여 각기 다른 환경에서 동작하기 때문에 Guest OS위의 한 모듈.. 2022. 3. 9.
[웹 크롤링] Jsoup? Jsoup? 자바로 만들어진 HTML 파서 이며 쉽고 강력한 기능을 제공한다. URL, 파일, 문자열을 소스로 하여 html을 파싱 가능 DOM 구조를 추적하거나 익숙한 CSS선택자를 사용하여 데이터를 찾아 추출 가능 문서내의 HTML요소, 속성, 텍스트 조작 가능 사용자가 입력한 데이터로부터 XSS(Cross-Site Script) 공격을 방지하기 위해서 안전한 화이트 리스트 방식으로 지정된 태그만 남기고 제거 가능 +XSS? 사용자 입력 값에 대한 필터링이 제대로 이루어지지 않을 경우, 공격자가 입력이 가능한 폼에 악의적인 스크립트를 삽입하여 해당 스크립트가 희생자 측에서 동작하도록 하여 악의적인 행위를 수행하는 취약점 Jsoup Document https://jsoup.org/ jsoup: Java.. 2022. 2. 22.
[웹 크롤링] 웹 크롤링? 웹 크롤링(Web Crawling)? web상에 존재하는 콘텐츠들을 수집하는 작업 원하는 조건에 맞는 데이터를 직접 수집하고 저장하는 목적을 가지고있다. HTML 페이지를 가져와서 파싱 후 데이터를 추출하는 기법 Selenium등 브라우저를 프로그래밍으로 조작해 필요 데이터만 추출하는 기법 대표적으로 Frontier / Fetcher / Parser가 있다. Frontier : 중복URL / 방문한 URL을 제외한 탐색할 URL을 Fetcher에 넘겨준다. Fetcher : 받아온 페이지의 html내용을 parser에 넘겨준다. Parser : 다른 하이퍼링크를 찾는 역할 Content Seen : 방문한 페이지의 본문이 이미 본 내용인지 Dup URL Elim : 방문한 페이지를 다시 방문하지 않도록 .. 2022. 2. 22.
반응형