Mysql
 sql >> база данни >  >> RDS >> Mysql

Красива супа изпипайте в mysql

Така че има няколко неща, които трябва да разгледате тук.

документите за PyMySQL са доста добри, за да ви накарат да работите.

Преди да можете да поставите тези неща в база данни обаче, трябва да ги вземете по начин, по който името на изпълнителя и песента да са свързани помежду си. Точно сега получавате отделен списък с изпълнители и песни, без начин да ги свържете. Ще искате да повторите класа title-artist, за да направите това.

Бих направил това така -

from urllib import urlopen
from bs4 import BeautifulSoup
import pymysql.cursors

# Webpage connection
html = urlopen("http://www.officialcharts.com/charts/singles-chart/19800203/7501/")

# Grab title-artist classes and iterate
bsObj = BeautifulSoup(html)
recordList = bsObj.findAll("div", {"class" : "title-artist",})

# Now iterate over recordList to grab title and artist
for record in recordList:
     title = record.find("div", {"class": "title",}).get_text().strip()
     artist = record.find("div", {"class": "artist"}).get_text().strip()
     print artist + ': ' + title

Това ще отпечата заглавието и изпълнителя за всяка итерация на цикъла recordList.

За да вмъкна тези стойности в MySQL DB, създадох таблица, наречена artist_song със следното:

CREATE TABLE `artist_song` (
  `id` int(11) NOT NULL AUTO_INCREMENT,
  `artist` varchar(255) COLLATE utf8_bin NOT NULL,
  `song` varchar(255) COLLATE utf8_bin NOT NULL,
  PRIMARY KEY (`id`)
  ) ENGINE=InnoDB DEFAULT CHARSET=utf8 COLLATE=utf8_bin
  AUTO_INCREMENT=1;

Това не е най-чистият начин за това, но идеята е добра. Искаме да отворим връзка с MySQL DB (аз извиках моята DB top_40) и да вмъкнем двойка изпълнител/заглавие за всяка итерация на цикъла recordList:

from urllib import urlopen
from bs4 import BeautifulSoup
import pymysql.cursors


# Webpage connection
html = urlopen("http://www.officialcharts.com/charts/singles-chart/19800203/7501/")

# Grab title-artist classes and store in recordList
bsObj = BeautifulSoup(html)
recordList = bsObj.findAll("div", {"class" : "title-artist",})

# Create a pymysql cursor and iterate over each title-artist record.
# This will create an INSERT statement for each artist/pair, then commit
# the transaction after reaching the end of the list. pymysql does not
# have autocommit enabled by default. After committing it will close
# the database connection.
# Create database connection

connection = pymysql.connect(host='localhost',
                             user='root',
                             password='password',
                             db='top_40',
                             charset='utf8mb4',
                             cursorclass=pymysql.cursors.DictCursor)

try:
    with connection.cursor() as cursor:
        for record in recordList:
            title = record.find("div", {"class": "title",}).get_text().strip()
            artist = record.find("div", {"class": "artist"}).get_text().strip()
            sql = "INSERT INTO `artist_song` (`artist`, `song`) VALUES (%s, %s)"
            cursor.execute(sql, (artist, title))
    connection.commit()
finally:
    connection.close()

Редактиране:Според моя коментар, мисля, че е по-ясно вместо това да се преглеждат редовете на таблицата:

from urllib import urlopen
from bs4 import BeautifulSoup
import pymysql.cursors


# Webpage connection
html = urlopen("http://www.officialcharts.com/charts/singles-chart/19800203/7501/")

bsObj = BeautifulSoup(html)

rows = bsObj.findAll('tr')
for row in rows:
    if row.find('span', {'class' : 'position'}):
        position = row.find('span', {'class' : 'position'}).get_text().strip()
        artist = row.find('div', {'class' : 'artist'}).get_text().strip()
        track = row.find('div', {'class' : 'title'}).get_text().strip()



  1. Database
  2.   
  3. Mysql
  4.   
  5. Oracle
  6.   
  7. Sqlserver
  8.   
  9. PostgreSQL
  10.   
  11. Access
  12.   
  13. SQLite
  14.   
  15. MariaDB
  1. Как да подобрим ефективността на заявката с подреждане по, групиране по и присъединяване

  2. премахване на специални символи в php

  3. свързване на външна mysql база данни с php

  4. Mysql е превишил грешката max_user_connections на уебсайта на c#

  5. Вмъкване на текст от текстова област в MySQL база данни без загуба на форматиране