Merge ad43251136 into 48c5663c5f

2020-10-22 18:00:34 +02:00 · 2020-10-22 18:00:34 +02:00 · a2987f16c6
parent 48c5663c5f ad43251136
commit a2987f16c6
2 changed files with 56 additions and 0 deletions
--- a/youtube_dl/extractor/extractors.py
+++ b/youtube_dl/extractor/extractors.py
@ -603,6 +603,7 @@ from .markiza import (
 from .massengeschmacktv import MassengeschmackTVIE
 from .matchtv import MatchTVIE
 from .mdr import MDRIE
+from .mediaklikk import MediaKlikkIE
 from .mediaset import MediasetIE
 from .mediasite import (
    MediasiteIE,
--- a/youtube_dl/extractor/mediaklikk.py
+++ b/youtube_dl/extractor/mediaklikk.py
@ -0,0 +1,55 @@
+# coding: utf-8
+from __future__ import unicode_literals
+
+from .common import InfoExtractor
+from ..compat import compat_urllib_parse_unquote
+import re
+
+
+class MediaKlikkIE(InfoExtractor):
+    # Named regular expression group: (?P<name>...) used for referencing match as 'id'
+    _VALID_URL = r'https?:\/\/(?:www\.)?(?:mediaklikk|m4sport|hirado)\.hu\/.*?videok?\/(?P<id>[^\/]+)\/?'
+
+    _TEST = {
+        'url': 'https://mediaklikk.hu/adal2020/video/2020/03/07/a-dal-donto/',
+        'info_dict': {
+            'id': 'kiberma-2020-04-30-i-adas',
+            'ext': 'mp4',
+            'title': 'KiberMa, 2020.04.30-i adás | MédiaKlikk',
+            # no thumbnail extractable
+        }
+    }
+
+    def _real_extract(self, url):
+        mobj = re.match(self._VALID_URL, url)
+        video_id = mobj.group('id')
+        display_id = video_id  # we only have one id in url..
+        webpage = self._download_webpage(url, video_id)
+
+        pattern = r"mtva_player_manager\.player\(document.getElementById\(.*\),\s?(\{.*\}).*\);"
+        info_json = self._html_search_regex(pattern, webpage, 'info_json')
+        info_meta = self._parse_json(compat_urllib_parse_unquote(info_json), None)
+
+        info_ret = {
+            '_type': 'video',
+            'title': info_meta.get('title') or video_id or self._og_search_title(webpage),
+            'ext': 'mp4',
+            'display_id': display_id,
+            'id': video_id
+        }
+
+        if 'series' in info_meta:
+            info_ret['series'] = info_meta['series']
+        info_meta['video'] = info_meta['token']
+        del info_meta['token']
+        playerpage = self._download_webpage('https://player.mediaklikk.hu/playernew/player.php', video_id, query=info_meta)
+        pattern = r"\"file\": \"(\\/\\/.*playlist\.m3u8)\","
+        playlist_url = 'https:' + compat_urllib_parse_unquote(
+            self._html_search_regex(pattern, playerpage, 'playlist_url'))\
+            .replace('\\/', '/')
+        formats = self._extract_wowza_formats(
+            playlist_url, video_id, skip_protocols=['f4m', 'smil', 'dash'])
+        self._sort_formats(formats)
+        info_ret['formats'] = formats
+
+        return info_ret