first commit

2022-04-21 19:23:01 +09:00
commit cfd562fd13
152 changed files with 54937 additions and 0 deletions
--- a/lib/system/logic_selenium.py
+++ b/lib/system/logic_selenium.py
@@ -0,0 +1,445 @@
+# -*- coding: utf-8 -*-
+#########################################################
+# python
+import os
+import traceback
+import logging
+import platform
+import time
+import base64
+
+# third-party
+from flask import (
+    Blueprint,
+    request,
+    Response,
+    send_file,
+    render_template,
+    redirect,
+    jsonify,
+)
+
+try:
+    from selenium import webdriver
+    from selenium.webdriver.support.ui import WebDriverWait
+    from PIL import Image
+
+    Image.MAX_IMAGE_PIXELS = None
+except:
+    pass
+from io import BytesIO
+
+# sjva 공용
+from framework.logger import get_logger
+from framework import path_app_root, path_data
+
+# 패키지
+from .plugin import logger, package_name
+from .model import ModelSetting
+
+#########################################################
+# apk --no-cache add --repository http://dl-cdn.alpinelinux.org/alpine/edge/testing firefox
+# https://github.com/mozilla/geckodriver/releases/download/v0.26.0/geckodriver-v0.26.0-linux64.tar.gz
+# curl -s -L "$url" | tar -xz
+
+
+class SystemLogicSelenium(object):
+    chrome_driver = None
+    chrome_driver_list = []
+
+    @staticmethod
+    def process_ajax(sub, req):
+        try:
+            if sub == "selenium_test_go":
+                driver = SystemLogicSelenium.get_driver()
+                driver.get(req.form["url"])
+                return jsonify("success")
+            elif sub == "capture":
+                driver = SystemLogicSelenium.get_driver()
+                img = Image.open(BytesIO((driver.get_screenshot_as_png())))
+
+                timestamp = time.time()
+                timestamp = str(timestamp).split(".")[0]
+                tmp = os.path.join(path_data, "tmp", "%s.png" % timestamp)
+                img.save(tmp)
+                from system.model import ModelSetting as SystemModelSetting
+
+                ddns = SystemModelSetting.get("ddns")
+                url = "%s/open_file%s" % (ddns, tmp)
+                logger.debug(url)
+                ret = {}
+                ret["ret"] = "success"
+                ret["data"] = url
+                return jsonify(ret)
+            elif sub == "full_capture":
+                driver = SystemLogicSelenium.get_driver()
+                img = SystemLogicSelenium.full_screenshot(driver)
+
+                timestamp = time.time()
+                timestamp = str(timestamp).split(".")[0]
+                tmp = os.path.join(path_data, "tmp", "%s.png" % timestamp)
+                img.save(tmp)
+                return send_file(tmp, mimetype="image/png")
+            elif sub == "cookie":
+                driver = SystemLogicSelenium.get_driver()
+                data = driver.get_cookies()
+                return jsonify(data)
+            elif sub == "daum_capcha":
+                daum_capcha = req.form["daum_capcha"]
+                driver = SystemLogicSelenium.get_driver()
+                # driver.find_element_by_xpath('//div[@class="secret_viewer"]/p/img').screenshot("captcha.png")
+                driver.find_element_by_xpath('//input[@id="answer"]').send_keys(
+                    daum_capcha
+                )
+                driver.find_element_by_xpath(
+                    '//input[@value="%s"]' % "확인"
+                ).click()
+                return jsonify({"ret": "success"})
+        except Exception as exception:
+            logger.error("Exception:%s", exception)
+            logger.error(traceback.format_exc())
+            return jsonify("exception")
+
+    @staticmethod
+    def get_pagesoruce_by_selenium(url, wait_xpath, retry=True):
+        try:
+            logger.debug("get_pagesoruce_by_selenium:%s %s", url, wait_xpath)
+            driver = SystemLogicSelenium.get_driver()
+            # logger.debug('driver : %s', driver)
+            driver.get(url)
+
+            WebDriverWait(driver, 10).until(
+                lambda driver: driver.find_element_by_xpath(wait_xpath)
+            )
+            # import time
+            # driver.save_screenshot('%s.png' % time.time())
+            # logger.debug('return page_source')
+            return driver.page_source
+        except Exception as exception:
+            # logger.debug(driver.page_source)
+            logger.error("Exception:%s", exception)
+            logger.error(traceback.format_exc())
+            SystemLogicSelenium.close_driver()
+            # SystemLogicSelenium.chrome_driver = None
+            if retry:
+                return SystemLogicSelenium.get_pagesoruce_by_selenium(
+                    url, wait_xpath, retry=False
+                )
+
+    # 1회성
+    @staticmethod
+    def get_driver(chrome_options=None):
+        try:
+            if SystemLogicSelenium.chrome_driver is None:
+                SystemLogicSelenium.chrome_driver = (
+                    SystemLogicSelenium.inner_create_driver(chrome_options)
+                )
+            return SystemLogicSelenium.chrome_driver
+        except Exception as exception:
+            logger.error("Exception:%s", exception)
+            logger.error(traceback.format_exc())
+
+    # 플러그인이 점유
+    @staticmethod
+    def create_driver(chrome_options=None):
+        try:
+            driver = SystemLogicSelenium.inner_create_driver(chrome_options)
+            if driver is not None:
+                SystemLogicSelenium.chrome_driver_list.append(driver)
+                return driver
+        except Exception as exception:
+            logger.error("Exception:%s", exception)
+            logger.error(traceback.format_exc())
+
+    @staticmethod
+    def close_driver():
+        try:
+            # if SystemLogicSelenium.chrome_driver is not None:
+            #    SystemLogicSelenium.chrome_driver.quit()
+            #    SystemLogicSelenium.chrome_driver = None
+            if SystemLogicSelenium.chrome_driver is not None:
+                try:
+                    SystemLogicSelenium.chrome_driver.close()
+                except Exception:
+                    pass
+                time.sleep(2)
+                try:
+                    SystemLogicSelenium.chrome_driver.quit()
+                except Exception:
+                    pass
+                SystemLogicSelenium.chrome_driver = None
+
+        except Exception as exception:
+            logger.error("Exception:%s", exception)
+            logger.error(traceback.format_exc())
+
+    @staticmethod
+    def inner_create_driver(chrome_options):
+        try:
+            driver = None
+            remote_url = ModelSetting.get("selenium_remote_url")
+            if remote_url.endswith("/wd/hub/"):
+                remote_url = remote_url[:-1]
+            if remote_url != "":
+                if chrome_options is None:
+                    chrome_options = webdriver.ChromeOptions()
+                    tmp = ModelSetting.get_list(
+                        "selenium_remote_default_option"
+                    )
+                    for t in tmp:
+                        chrome_options.add_argument(t)
+                driver = webdriver.Remote(
+                    command_executor=remote_url,
+                    desired_capabilities=chrome_options.to_capabilities(),
+                )
+                driver.set_window_size(1920, 1080)
+                logger.debug("Using Remote :%s", driver)
+            else:
+                path_chrome = os.path.join(
+                    path_app_root, "bin", platform.system(), "chromedriver"
+                )
+                if platform.system() == "Windows":
+                    path_chrome += ".exe"
+                if chrome_options is None:
+                    chrome_options = webdriver.ChromeOptions()
+                    tmp = ModelSetting.get_list(
+                        "selenium_binary_default_option"
+                    )
+                    for t in tmp:
+                        chrome_options.add_argument(t)
+                driver = webdriver.Chrome(
+                    path_chrome, chrome_options=chrome_options
+                )
+                logger.debug("Using local bin :%s", driver)
+            if driver is not None:
+                return driver
+        except Exception as exception:
+            logger.error("Exception:%s", exception)
+            logger.error(traceback.format_exc())
+
+    @staticmethod
+    def plugin_unload():
+        try:
+            SystemLogicSelenium.close_driver()
+            # logger.debug(SystemLogicSelenium.chrome_driver)
+            # if SystemLogicSelenium.chrome_driver is not None:
+            #    SystemLogicSelenium.chrome_driver.quit()
+            #    logger.debug(SystemLogicSelenium.chrome_driver)
+
+            for tmp in SystemLogicSelenium.chrome_driver_list:
+                if tmp is not None:
+                    tmp.quit()
+
+        except Exception as exception:
+            logger.error("Exception:%s", exception)
+            logger.error(traceback.format_exc())
+
+    @staticmethod
+    def get_text_excluding_children(driver, element):
+        return driver.execute_script(
+            """
+        return jQuery(arguments[0]).contents().filter(function() {
+            return this.nodeType == Node.TEXT_NODE;
+        }).text();
+        """,
+            element,
+        )
+
+    @staticmethod
+    def full_screenshot(driver, low_offset=0):
+        try:
+            # initiate value
+            # save_path = save_path + '.png' if save_path[-4::] != '.png' else save_path
+            img_li = []  # to store image fragment
+            offset = 0  # where to start
+
+            # js to get height
+            height = driver.execute_script(
+                "return Math.max("
+                "document.documentElement.clientHeight, window.innerHeight);"
+            )
+            # height = height - low_offset
+            # js to get the maximum scroll height
+            # Ref--> https://stackoverflow.com/questions/17688595/finding-the-maximum-scroll-position-of-a-page
+            max_window_height = driver.execute_script(
+                "return Math.max("
+                "document.body.scrollHeight, "
+                "document.body.offsetHeight, "
+                "document.documentElement.clientHeight, "
+                "document.documentElement.scrollHeight, "
+                "document.documentElement.offsetHeight);"
+            )
+
+            # looping from top to bottom, append to img list
+            # Ref--> https://gist.github.com/fabtho/13e4a2e7cfbfde671b8fa81bbe9359fb
+
+            while offset < max_window_height:
+
+                # Scroll to height
+                driver.execute_script(
+                    """
+                window.scrollTo(0, arguments[0]);
+                """,
+                    offset,
+                )
+                img = Image.open(BytesIO((driver.get_screenshot_as_png())))
+
+                if low_offset != 0:
+                    img = img.crop(
+                        (0, 0, img.width, img.height - low_offset)
+                    )  # defines crop points
+
+                img_li.append(img)
+                offset += height
+                logger.debug("offset : %s / %s", offset, max_window_height)
+
+            # Stitch image into one
+            # Set up the full screen frame
+            img_frame_height = sum([img_frag.size[1] for img_frag in img_li])
+            img_frame = Image.new("RGB", (img_li[0].size[0], img_frame_height))
+            offset = 0
+            for img_frag in img_li:
+                img_frame.paste(img_frag, (0, offset))
+                offset += img_frag.size[1]
+                logger.debug("paste offset : %s ", offset)
+            # img_frame.save(save_path)
+            # return
+            return img_frame
+        except Exception as exception:
+            logger.error("Exception:%s", exception)
+            logger.error(traceback.format_exc())
+
+    @staticmethod
+    def remove_element(driver, element):
+        driver.execute_script(
+            """
+        var element = arguments[0];
+        element.parentNode.removeChild(element);
+        """,
+            element,
+        )
+
+    ######################################################################
+    @staticmethod
+    def __get_downloaded_files(driver=None):
+        if driver is None:
+            driver = SystemLogicSelenium.get_driver()
+        if not driver.current_url.startswith("chrome://downloads"):
+            driver.get("chrome://downloads/")
+        # driver.implicitly_wait(4)
+        return driver.execute_script(
+            "return downloads.Manager.get().items_   "
+            "  .filter(e => e.state === 'COMPLETE')  "
+            "  .map(e => e.filePath || e.file_path); "
+        )
+
+    @staticmethod
+    def get_file_content(path, driver=None):
+        if driver is None:
+            driver = SystemLogicSelenium.get_driver()
+
+        elem = driver.execute_script(
+            "var input = window.document.createElement('INPUT'); "
+            "input.setAttribute('type', 'file'); "
+            "input.hidden = true; "
+            "input.onchange = function (e) { e.stopPropagation() }; "
+            "return window.document.documentElement.appendChild(input); "
+        )
+
+        elem._execute("sendKeysToElement", {"value": [path], "text": path})
+
+        result = driver.execute_async_script(
+            "var input = arguments[0], callback = arguments[1]; "
+            "var reader = new FileReader(); "
+            "reader.onload = function (ev) { callback(reader.result) }; "
+            "reader.onerror = function (ex) { callback(ex.message) }; "
+            "reader.readAsDataURL(input.files[0]); "
+            "input.remove(); ",
+            elem,
+        )
+
+        if not result.startswith("data:"):
+            raise Exception("Failed to get file content: %s" % result)
+
+        return base64.b64decode(result[result.find("base64,") + 7 :])
+
+    @staticmethod
+    def get_downloaded_files(driver=None):
+        if driver is None:
+            driver = SystemLogicSelenium.get_driver()
+
+        # files = WebDriverWait(driver, 20, 1).until(SystemLogicSelenium.__get_downloaded_files)
+        files = SystemLogicSelenium.__get_downloaded_files()
+        return files
+
+    @staticmethod
+    def waitUntilDownloadCompleted(maxTime=600, driver=None):
+        if driver is None:
+            driver = SystemLogicSelenium.get_driver()
+        driver.execute_script("window.open()")
+        # switch to new tab
+        driver.switch_to.window(driver.window_handles[-1])
+        # navigate to chrome downloads
+        driver.get("chrome://downloads")
+        # define the endTime
+        endTime = time.time() + maxTime
+        while True:
+            try:
+                # get the download percentage
+                downloadPercentage = driver.execute_script(
+                    "return document.querySelector('downloads-manager').shadowRoot.querySelector('#downloadsList downloads-item').shadowRoot.querySelector('#progress').value"
+                )
+                # check if downloadPercentage is 100 (otherwise the script will keep waiting)
+                if downloadPercentage == 100:
+                    # exit the method once it's completed
+                    return downloadPercentage
+            except:
+                pass
+            # wait for 1 second before checking the percentage next time
+            time.sleep(1)
+            # exit method if the download not completed with in MaxTime.
+            if time.time() > endTime:
+                break
+
+
+"""
+
+
+driver = webdriver.Chrome(desired_capabilities=capabilities_chrome)
+#driver = webdriver.Remote('http://127.0.0.1:5555/wd/hub', capabilities_chrome)
+
+# download a pdf file
+driver.get("https://www.mozilla.org/en-US/foundation/documents")
+driver.find_element_by_css_selector("[href$='.pdf']").click()
+
+# list all the completed remote files (waits for at least one)
+files = WebDriverWait(driver, 20, 1).until(get_downloaded_files)
+
+# get the content of the first file remotely
+content = get_file_content(driver, files[0])
+
+# save the content in a local file in the working directory
+with open(os.path.basename(files[0]), 'wb') as f:
+  f.write(content)
+
+
+capabilities_chrome = { \
+    'browserName': 'chrome',
+    # 'proxy': { \
+     # 'proxyType': 'manual',
+     # 'sslProxy': '50.59.162.78:8088',
+     # 'httpProxy': '50.59.162.78:8088'
+    # },
+    'goog:chromeOptions': { \
+      'args': [
+      ],
+      'prefs': { \
+        # 'download.default_directory': "",
+        # 'download.directory_upgrade': True,
+        'download.prompt_for_download': False,
+        'plugins.always_open_pdf_externally': True,
+        'safebrowsing_for_trusted_sources_enabled': False
+      }
+    }
+  }
+"""