Find-it-Auto

Sleeping

App Files Files Community

Omnibus commited on Dec 31, 2023

Commit

f586a70

1 Parent(s): 26f9624

Update app.py

Browse files

Files changed (1) hide show

app.py +27 -21

app.py CHANGED Viewed

@@ -4,38 +4,21 @@ import requests
 import bs4
 import lxml
-def find_it1(url,q=None,num=None):
-    out = []
     rawp = []
     source = urllib.request.urlopen(url).read()
     soup = bs4.BeautifulSoup(source,'lxml')
     # title of the page
     print(soup.title)
     # get attributes:
     print(soup.title.name)
     # get values:
     print(soup.title.string)
     # beginning navigation:
     print(soup.title.parent.name)
     # getting specific values:
     print(soup.p)
     print(soup.find_all('p'))
-    for p in soup.find_all(f'{q}'):
-        #print(paragraph.string)
-        #print(str(paragraph.text))
-        #out.append(f'{p}\n')
-        #out.append(f'{p.string}\n')
-        #out.append(f'{p.text}\n')
-        #out.append("\n")
-        out.append(p)
-        out.append(p.string)
-        out.append(p.text)
-    #print([str(tag) for tag in soup.find_all()])
     for tag in soup.find_all():
         rawp.append(tag)
     for url in soup.find_all('a'):
@@ -44,7 +27,25 @@ def find_it1(url,q=None,num=None):
     print(soup.get_text())
-    return rawp, out
 def find_it2(url):
     response = requests.get(url,a1=None,q2=None,q3=None)
@@ -63,10 +64,15 @@ with gr.Blocks() as app:
         inp = gr.Textbox()
         q = gr.Textbox(value="p")
         num = gr.Number(value=1)
-    btn = gr.Button()
     with gr.Row():
         rawp = gr.JSON()
         outp = gr.JSON()
-    btn.click(find_it1,[inp,q,num],[rawp,outp])
 app.launch()

 import bs4
 import lxml
+def find_all(url,q=None,num=None):
     rawp = []
     source = urllib.request.urlopen(url).read()
     soup = bs4.BeautifulSoup(source,'lxml')
     # title of the page
     print(soup.title)
     # get attributes:
     print(soup.title.name)
     # get values:
     print(soup.title.string)
     # beginning navigation:
     print(soup.title.parent.name)
     # getting specific values:
     print(soup.p)
     print(soup.find_all('p'))
     for tag in soup.find_all():
         rawp.append(tag)
     for url in soup.find_all('a'):
     print(soup.get_text())
+    return rawp
+def find_it(url,q=None,num=None):
+    out = []
+    source = urllib.request.urlopen(url).read()
+    soup = bs4.BeautifulSoup(source,'lxml')
+    for p in soup.find_all(f'{q}'):
+        out.append(p)
+        out.append(p.string)
+        out.append(p.parent)
+    for tag in soup.find_all():
+        rawp.append(tag.name)
+        rawp.append(tag.string)
+    for url in soup.find_all('a'):
+        print(url.get('href'))
+    print(soup.get_text())
+    return out
 def find_it2(url):
     response = requests.get(url,a1=None,q2=None,q3=None)
         inp = gr.Textbox()
         q = gr.Textbox(value="p")
         num = gr.Number(value=1)
+    with gr.Row():
+        all_btn = gr.Button("Load")
+        find_btn = gr.Button("Find")
     with gr.Row():
         rawp = gr.JSON()
         outp = gr.JSON()
+    all_btn.click(find_all,[inp,q,num],[rawp])
+    find_btn.click(find_it,[inp,q,num],[outp])
 app.launch()