2018-11-20 23:16:19 +01:00
# coding: utf-8
from __future__ import unicode_literals
from . common import InfoExtractor
2018-11-21 00:38:08 +01:00
2018-11-20 23:16:19 +01:00
class NarandoIE ( InfoExtractor ) :
_VALID_URL = r ' https?://(?:www \ .)?narando \ .com/articles/(?P<id>([a-zA-Z]|-)+) '
_TEST = {
' url ' : ' https://narando.com/articles/an-ihrem-selbstlob-erkennt-man-sie ' ,
' md5 ' : ' d20f671f0395bab8f8285d1f6e8f965e ' ,
' info_dict ' : {
' id ' : ' an-ihrem-selbstlob-erkennt-man-sie ' ,
' ext ' : ' mp3 ' ,
' title ' : ' An ihrem Selbstlob erkennt man sie ' ,
' url ' : ' https://static.narando.com/sounds/10492/original.mp3 ' ,
2018-11-21 00:28:29 +01:00
' description ' : u ' omnisophie.com: Kaum eine Woche vergeht, dass nicht jemand mir gegenüber seine Mathematik-Unkenntnisse tränenlos beweint. „In Mathe war ich niemals gut.“ Diese Leute sagen mir das wohl, weil ich Mathematiker bin, und da gehört so ein fröhliches „Understatement“ zum Small Talk. So wie wenn ich selbst bedauernd-entschuldigend auf meine grauen Haare zeige. Ich kann eben auch nicht alles bieten... „Mathe kann ich nicht“, „Ich habe kein Internet“ oder „Ich will auch bewusst nicht alles können“ wird fast wie Eigenlob vorgetragen. ' ,
2018-11-20 23:16:19 +01:00
# TODO more properties, either as:
# * A value
# * MD5 checksum; start the string with md5:
# * A regular expression; start the string with re:
# * Any Python type (for example int or float)
}
}
def _real_extract ( self , url ) :
video_id = self . _match_id ( url )
# webpage = self._download_webpage(url,"?")
# print(url)
# print('https://narando.com/articles/'+video_id)
2018-11-21 00:38:08 +01:00
webpage = self . _download_webpage ( ' https://narando.com/articles/ ' + video_id , video_id )
2018-11-20 23:16:19 +01:00
# TODO more code goes here, for example ...
title = self . _html_search_regex ( r ' <h1 class= " visible-xs h3 " >(.+?)</h1> ' , webpage , ' title ' )
# print(title)
player_id = self . _html_search_regex ( " " . join ( r ' [ \ n \ r].*https: \ / \ /narando.com \ /r \ / \ s*([^ " ]*) ' . split ( ) ) , webpage , ' player_id ' )
2018-11-21 00:38:08 +01:00
player_page = self . _download_webpage ( ' https://narando.com/widget?r= ' + player_id , player_id )
2018-11-21 00:28:29 +01:00
download_url = self . _html_search_regex ( r ' .<div class= " stream_url hide " > \ s*([^?]*) ' , player_page , ' download_url ' )
2018-11-21 00:38:08 +01:00
description = self . _html_search_regex ( r ' <meta content= " (.+?) " property= " og:description " /> ' , webpage , ' description ' )
2018-11-20 23:16:19 +01:00
return {
' id ' : video_id ,
' title ' : title ,
' url ' : download_url ,
2018-11-21 00:28:29 +01:00
' description ' : description ,
2018-11-20 23:16:19 +01:00
# TODO more properties (see youtube_dl/extractor/common.py)
}