MetaGer.php 44.8 KB
Newer Older
1
2
3
4
<?php
namespace App;

use App;
5
use Cache;
6
7
use Illuminate\Http\Request;
use Jenssegers\Agent\Agent;
Dominik Hebeler's avatar
Bugfix    
Dominik Hebeler committed
8
use LaravelLocalization;
9
use Log;
10
use Predis\Connection\ConnectionException;
11
use Redis;
12
13
14

class MetaGer
{
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
    # Einstellungen für die Suche
    protected $fokus;
    protected $eingabe;
    protected $q;
    protected $category;
    protected $time;
    protected $page;
    protected $lang;
    protected $cache = "";
    protected $site;
    protected $hostBlacklist   = [];
    protected $domainBlacklist = [];
    protected $stopWords       = [];
    protected $phrases         = [];
    protected $engines         = [];
    protected $results         = [];
    protected $ads             = [];
Dominik Hebeler's avatar
Dominik Hebeler committed
32
    protected $products        = [];
33
34
35
    protected $warnings        = [];
    protected $errors          = [];
    protected $addedHosts      = [];
36
    protected $startCount      = 0;
37
    protected $canCache        = false;
38
39
40
41
42
43
44
45
46
    # Daten über die Abfrage
    protected $ip;
    protected $language;
    protected $agent;
    # Konfigurationseinstellungen:
    protected $sumaFile;
    protected $mobile;
    protected $resultCount;
    protected $sprueche;
47
    protected $maps;
48
    protected $newtab;
49
    protected $domainsBlacklisted = [];
50
    protected $urlsBlacklisted    = [];
51
52
53
    protected $url;
    protected $languageDetect;

54
55
    public function __construct()
    {
56
        # Timer starten
57
        $this->starttime = microtime(true);
58
59

        # Versuchen Blacklists einzulesen
60
61
        if (file_exists(config_path() . "/blacklistDomains.txt") && file_exists(config_path() . "/blacklistUrl.txt")) {
            $tmp                      = file_get_contents(config_path() . "/blacklistDomains.txt");
62
            $this->domainsBlacklisted = explode("\n", $tmp);
63
64
65
            $tmp                      = file_get_contents(config_path() . "/blacklistUrl.txt");
            $this->urlsBlacklisted    = explode("\n", $tmp);
        } else {
66
            Log::warning("Achtung: Eine, oder mehrere Blacklist Dateien, konnten nicht geöffnet werden");
67
68
        }

69
        # Parser Skripte einhängen
70
71
72
73
        $dir = app_path() . "/Models/parserSkripte/";
        foreach (scandir($dir) as $filename) {
            $path = $dir . $filename;
            if (is_file($path)) {
74
                require_once $path;
75
76
77
            }
        }

78
        # Cachebarkeit testen
79
80
81
82
83
84
        try {
            Cache::has('test');
            $this->canCache = true;
        } catch (ConnectionException $e) {
            $this->canCache = false;
        }
85
    }
86

87
    # Erstellt aus den gesammelten Ergebnissen den View
88
89
90
    public function createView()
    {
        $viewResults = [];
91
        # Wir extrahieren alle notwendigen Variablen und geben Sie an unseren View:
92
        foreach ($this->results as $result) {
93
94
95
96
97
98
            $viewResults[] = get_object_vars($result);
        }

        # Wir müssen natürlich noch den Log für die durchgeführte Suche schreiben:
        $this->createLogs();

99
100
        if ($this->fokus === "bilder") {
            switch ($this->out) {
101
102
103
104
105
106
107
108
                case 'results':
                    return view('metager3bilderresults')
                        ->with('results', $viewResults)
                        ->with('eingabe', $this->eingabe)
                        ->with('mobile', $this->mobile)
                        ->with('warnings', $this->warnings)
                        ->with('errors', $this->errors)
                        ->with('metager', $this)
109
                        ->with('browser', (new Agent())->browser());
110
111
112
113
114
115
116
117
                default:
                    return view('metager3bilder')
                        ->with('results', $viewResults)
                        ->with('eingabe', $this->eingabe)
                        ->with('mobile', $this->mobile)
                        ->with('warnings', $this->warnings)
                        ->with('errors', $this->errors)
                        ->with('metager', $this)
118
                        ->with('browser', (new Agent())->browser());
119
            }
120
121
122
123
124
125
126
127
128
129
130
131
132
133
134
135
136
137
138
139
140
141
142
143
144
145
146
147
148
149
150
151
152
        } else {
            switch ($this->out) {
                case 'results':
                    return view('metager3results')
                        ->with('results', $viewResults)
                        ->with('eingabe', $this->eingabe)
                        ->with('mobile', $this->mobile)
                        ->with('warnings', $this->warnings)
                        ->with('errors', $this->errors)
                        ->with('metager', $this)
                        ->with('browser', (new Agent())->browser());
                    break;
                case 'results-with-style':
                    return view('metager3')
                        ->with('results', $viewResults)
                        ->with('eingabe', $this->eingabe)
                        ->with('mobile', $this->mobile)
                        ->with('warnings', $this->warnings)
                        ->with('errors', $this->errors)
                        ->with('metager', $this)
                        ->with('suspendheader', "yes")
                        ->with('browser', (new Agent())->browser());
                    break;
                default:
                    return view('metager3')
                        ->with('eingabe', $this->eingabe)
                        ->with('mobile', $this->mobile)
                        ->with('warnings', $this->warnings)
                        ->with('errors', $this->errors)
                        ->with('metager', $this)
                        ->with('browser', (new Agent())->browser());
                    break;
            }
153
154
155
        }
    }

Phil Höfer's avatar
Phil Höfer committed
156
    public function prepareResults()
157
    {
Phil Höfer's avatar
Phil Höfer committed
158
        $engines = $this->engines;
159

Phil Höfer's avatar
Phil Höfer committed
160
161
        // combine
        $combinedResults = $this->combineResults($engines);
162
163
164
165

        # Wir bestimmen die Sprache eines jeden Suchergebnisses
        $this->results = $this->addLangCodes($this->results);

Phil Höfer's avatar
Phil Höfer committed
166
167
168
169
170
171
        // sort
        //$sortedResults = $this->sortResults($engines);
        // filter
        // augment (boost&adgoal)
        // authorize
        // misc (WiP)
172
173
        uasort($this->results, function ($a, $b) {
            if ($a->getRank() == $b->getRank()) {
174
                return 0;
175
176
            }

177
178
            return ($a->getRank() < $b->getRank()) ? 1 : -1;
        });
179

180
181
        # Validate Results
        $newResults = [];
182
183
        foreach ($this->results as $result) {
            if ($result->isValid($this)) {
184
                $newResults[] = $result;
185
186
            }

187
188
189
        }
        $this->results = $newResults;

190
191
192
193
194
195
        # Boost implementation
        $this->results = $this->parseBoost($this->results);

        #Adgoal Implementation
        $this->results = $this->parseAdgoal($this->results);

196
        $counter   = 0;
197
        $firstRank = 0;
198

199
        if (isset($this->startForwards)) {
200
            $this->startCount = $this->startForwards;
201
        } elseif (isset($this->startBackwards)) {
202
            $this->startCount = $this->startBackwards - count($this->results) - 1;
203
        } else {
204
205
206
            $this->startCount = 0;
        }

207
208
        foreach ($this->results as $result) {
            if ($counter === 0) {
209
                $firstRank = $result->rank;
210
211
            }

212
            $counter++;
213
            $result->number = $counter + $this->startCount;
214
215
216
217
            $confidence     = 0;
            if ($firstRank > 0) {
                $confidence = $result->rank / $firstRank;
            } else {
218
                $confidence = 0;
219
220
221
            }

            if ($confidence > 0.65) {
222
                $result->color = "#FF4000";
223
            } elseif ($confidence > 0.4) {
224
                $result->color = "#FF0080";
225
            } elseif ($confidence > 0.2) {
226
                $result->color = "#C000C0";
227
            } else {
228
                $result->color = "#000000";
229
230
            }

231
232
        }

233
        if (LaravelLocalization::getCurrentLocale() === "en") {
234
235
236
            $this->ads = [];
        }

237
        $this->validated = false;
238
        if (isset($this->password)) {
239
240
241
            # Wir bieten einen bezahlten API-Zugriff an, bei dem dementsprechend die Werbung ausgeblendet wurde:
            # Aktuell ist es nur die Uni-Mainz. Deshalb überprüfen wir auch nur diese.
            $password = getenv('mainz');
242
            $eingabe  = $this->eingabe;
243
            $password = md5($eingabe . $password);
244
245
            if ($this->password === $password) {
                $this->ads       = [];
246
                $this->products  = [];
247
                $this->validated = true;
248
                $this->maps      = false;
249
250
            }
        }
251
252

        if (count($this->results) <= 0) {
253
            $this->errors[] = trans('metaGer.results.failed');
254
        }
255

256
        if ($this->canCache() && isset($this->next) && count($this->next) > 0 && count($this->results) > 0) {
257
            $page       = $this->page + 1;
258
            $this->next = [
259
260
261
                'page'          => $page,
                'startForwards' => $this->results[count($this->results) - 1]->number,
                'engines'       => $this->next,
262
263
            ];
            Cache::put(md5(serialize($this->next)), serialize($this->next), 60);
264
265
        } else {
            $this->next = [];
266
267
        }

268
    }
269

270
271
    private function addLangCodes($results)
    {
272
273
274
275
276
        # Wenn es keine Ergebnisse gibt, brauchen wir uns gar nicht erst zu bemühen
        if (sizeof($results) === 0) {
            return $results;
        }

277
278
279
280
281
282
283
284
285
286
287
288
289
290
291
292
293
294
295
296
297
298
299
300
301
302
303
304
305
306
307
308
309
310
311
312
313
314
315
        # Bei der Spracheinstellung "all" wird nicht gefiltert
        if ($this->getLang() === "all") {
            return $results;
        } else {
            # Ansonsten müssen wir jedem Result einen Sprachcode hinzufügen
            $id          = 0;
            $langStrings = [];
            foreach ($results as $result) {
                # Wir geben jedem Ergebnis eine ID um später die Sprachcodes zuordnen zu können
                $result->id = $id;

                $langStrings["result_" . $id] = utf8_encode($result->getLangString());

                $id++;
            }
            # Wir schreiben die Strings in eine temporäre JSON-Datei,
            # Da das Array unter umständen zu groß ist für eine direkte Übergabe an das Skript
            $filename = "/tmp/" . getmypid();
            file_put_contents($filename, json_encode($langStrings));
            $langDetectorPath = app_path() . "/Models/lang.pl";
            $lang             = exec("echo '$filename' | $langDetectorPath");
            $lang             = json_decode($lang, true);

            # Wir haben nun die Sprachcodes der einzelnen Ergebnisse.
            # Diese müssen wir nur noch korrekt zuordnen, dann sind wir fertig.
            foreach ($lang as $key => $langCode) {
                # Prefix vom Key entfernen:
                $id = intval(str_replace("result_", "", $key));
                foreach ($this->results as $result) {
                    if ($result->id === $id) {
                        $result->langCode = $langCode;
                        break;
                    }
                }
            }
            return $results;
        }
    }

316
317
318
319
320
321
322
323
324
325
326
327
328
329
330
331
332
333
334
    /**
     * Diese Funktion überprüft, ob wir einen erweiterten Check auf Bots machen müssen.
     * Z.B.: Wurden wir von einem Bot (dessen Anfragen aus dem Tor-Netzwerk kamen) mit tausenden
     * Anfragen zu Telefonnummern überschwemmt. Bei diesen werden wir nun eine erweiterte Überprüfung
     * durchführen.
     * Für den Anfang werden wir alle Anfragen, die unter diese Kriterien fallen, nur noch beantworten, wenn
     * JavaScript ausgeführt wird. (Mal schauen ob und wie lange dies ausreicht)
     */
    public function doBotProtection($bot)
    {
        $hash = md5(date('YmdHi'));
        if (preg_match("/^\d+$/s", $this->getEingabe()) && $bot !== $hash) {
            return true;
        } else {
            return false;
        }

    }

Phil Höfer's avatar
Phil Höfer committed
335
336
337
338
339
340
341
342
343
344
345
346
347
348
349
350
351
352
353
354
355
356
357
358
    public function combineResults($engines)
    {
        foreach ($engines as $engine) {
            if (isset($engine->next)) {
                $this->next[] = $engine->next;
            }
            if (isset($engine->last)) {
                $this->last[] = $engine->last;
            }
            foreach ($engine->results as $result) {
                if ($result->valid) {
                    $this->results[] = $result;
                }
            }
            foreach ($engine->ads as $ad) {
                $this->ads[] = $ad;
            }
            foreach ($engine->products as $product) {
                $this->products[] = $product;
            }
        }

    }

359
360
    public function parseBoost($results)
    {
361
362
363
364
365
366
367
368
369
370
371
372
        foreach ($results as $result) {
            if (preg_match('/^(http[s]?\:\/\/)?(www.)?amazon\.de/', $result->anzeigeLink)) {
                if (preg_match('/\?/', $result->anzeigeLink)) {
                    $result->link .= '&tag=boostmg01-21';
                } else {
                    $result->link .= '?tag=boostmg01-21';
                }
                $result->partnershop = true;

            }
        }
        return $results;
373
    }
374

375
376
    public function parseAdgoal($results)
    {
377
        $publicKey  = getenv('adgoal_public');
378
        $privateKey = getenv('adgoal_private');
379
        if ($publicKey === false) {
380
381
382
            return $results;
        }
        $tldList = "";
383
384
        try {
            foreach ($results as $result) {
385
                $link = $result->anzeigeLink;
386
                if (strpos($link, "http") !== 0) {
387
388
389
390
391
392
393
394
395
396
                    $link = "http://" . $link;
                }
                $tldList .= parse_url($link, PHP_URL_HOST) . ",";
                $result->tld = parse_url($link, PHP_URL_HOST);
            }
            $tldList = rtrim($tldList, ",");

            # Hashwert
            $hash = md5("meta" . $publicKey . $tldList . "GER");

397
            # Query
398
399
            $query = urlencode($this->q);

400
            $link   = "https://api.smartredirect.de/api_v2/CheckForAffiliateUniversalsearchMetager.php?p=" . $publicKey . "&k=" . $hash . "&tld=" . $tldList . "&q=" . $query;
401
402
403
            $answer = json_decode(file_get_contents($link));

            # Nun müssen wir nur noch die Links für die Advertiser ändern:
404
            foreach ($answer as $el) {
405
                $hoster = $el[0];
406
                $hash   = $el[1];
407

408
409
                foreach ($results as $result) {
                    if ($hoster === $result->tld) {
410
411
                        # Hier ist ein Advertiser:
                        # Das Logo hinzufügen:
412
                        if ($result->image !== "") {
413
                            $result->logo = "https://img.smartredirect.de/logos_v2/60x30/" . $hash . ".gif";
414
                        } else {
415
                            $result->image = "https://img.smartredirect.de/logos_v2/120x60/" . $hash . ".gif";
416
417
                        }

418
419
420
                        # Den Link hinzufügen:
                        $publicKey = $publicKey;
                        $targetUrl = $result->anzeigeLink;
421
                        if (strpos($targetUrl, "http") !== 0) {
422
                            $targetUrl = "http://" . $targetUrl;
423
424
425
426
427
                        }

                        $gateHash            = md5($targetUrl . $privateKey);
                        $newLink             = "https://api.smartredirect.de/api_v2/ClickGate.php?p=" . $publicKey . "&k=" . $gateHash . "&url=" . urlencode($targetUrl) . "&q=" . $query;
                        $result->link        = $newLink;
428
429
430
431
                        $result->partnershop = true;
                    }
                }
            }
432
        } catch (\ErrorException $e) {
433
434
435
436
437
            return $results;
        }

        return $results;
    }
438

Karl's avatar
Karl committed
439
440
441
442
    /*
     * Die Erstellung der Suchmaschinen bis die Ergebnisse da sind mit Unterfunktionen
     */

443
444
    public function createSearchEngines(Request $request)
    {
445
        # Wenn es kein Suchwort gibt
446
        if (!$request->has("eingabe") || $this->q === "") {
447
            return;
448
        }
449

450
        $xml                  = simplexml_load_file($this->sumaFile);
451
        $sumas                = $xml->xpath("suma");
452
        $enabledSearchengines = [];
453
        $overtureEnabled      = false;
454
455
        $sumaCount            = 0;

Karl's avatar
Karl committed
456
        /* Erstellt die Liste der eingestellten Sumas
457
458
459
         * Der einzige Unterschied bei angepasstem Suchfokus ist,
         * dass nicht nach den Typen einer Suma,
         * sondern den im Request mitgegebenen Typen entschieden wird.
Karl's avatar
Karl committed
460
461
462
463
464
465
         * Ansonsten wird genau das selbe geprüft und gemacht:
         * Handelt es sich um spezielle Suchmaschinen die immer an sein müssen
         * Wenn es Overture ist vermerken dass Overture an ist
         * Suma Zähler erhöhen
         * Zu Liste hinzufügen
         */
466
        foreach ($sumas as $suma) {
467
            if (($this->sumaIsSelected($suma, $request)
468
                || (!$this->isBildersuche()
469
                    && $this->sumaIsAdsuche($suma, $overtureEnabled)))
470
471
472
                && (!$this->sumaIsDisabled($suma))) {
                if ($this->sumaIsOverture($suma)) {
                    $overtureEnabled = true;
473
                }
474
475
                if ($this->sumaIsNotAdsuche($suma)) {
                    $sumaCount += 1;
476
                }
477
                $enabledSearchengines[] = $suma;
478
479
480
481
482
            }
        }

        # Sonderregelung für alle Suchmaschinen, die zu den Minisuchern gehören. Diese können alle gemeinsam über einen Link abgefragt werden
        $subcollections = [];
483
484

        $tmp = [];
485
486
        foreach ($enabledSearchengines as $engine) {
            if (isset($engine['minismCollection'])) {
487
                $subcollections[] = $engine['minismCollection']->__toString();
488
            } else {
489
                $tmp[] = $engine;
490
491
            }

492
493
        }
        $enabledSearchengines = $tmp;
494
        if (sizeof($subcollections) > 0) {
495
            $enabledSearchengines[] = $this->loadMiniSucher($xml, $subcollections);
496
497
        }

498
        if ($sumaCount <= 0) {
499
            $this->errors[] = trans('metaGer.settings.noneSelected');
500
        }
501

502
        $engines = [];
503

504
        # Wenn eine Sitesearch durchgeführt werden soll, überprüfen wir ob überhaupt eine der Suchmaschinen eine Sitesearch unterstützt
505
        $siteSearchFailed = $this->checkCanNotSitesearch($enabledSearchengines);
506
507

        $typeslist = [];
508
        $counter   = 0;
509

510
511
        if ($this->requestIsCached($request)) {
            $engines = $this->getCachedEngines($request);
512
        } else {
513
            $engines = $this->actuallyCreateSearchEngines($enabledSearchengines, $siteSearchFailed);
514
        }
515

516
        # Wir starten alle Suchen
517
518
        foreach ($engines as $engine) {
            $engine->startSearch($this);
519
        }
520

521
522
        $this->adjustFocus($sumas, $enabledSearchengines);

523
524
525
526
527
        /* Wir warten auf die Antwort der Suchmaschinen
         * Die Verbindung steht zu diesem Zeitpunkt und auch unsere Requests wurden schon gesendet.
         * Wir zählen die Suchmaschinen, die durch den Cache beantwortet wurden:
         * $enginesToLoad zählt einerseits die Suchmaschinen auf die wir warten und andererseits
         * welche Suchmaschinen nicht rechtzeitig geantwortet haben.
528
529
         */

530
        $enginesToLoad = [];
531
532
533
534
535
536
        $canBreak      = false;
        foreach ($engines as $engine) {
            if ($engine->cached) {
                if ($overtureEnabled && ($engine->name === "overture" || $engine->name === "overtureAds")) {
                    $canBreak = true;
                }
537
538
            } else {
                $enginesToLoad[$engine->name] = false;
539
540
541
542
543
544
545
546
            }
        }

        $this->waitForResults($enginesToLoad, $overtureEnabled, $canBreak);

        $this->retrieveResults($engines);
    }

547
548
549
550
551
552
553
554
555
556
557
558
559
560
561
562
563
564
565
566
567
568
569
570
571
572
573
574
575
576
577
578
579
580
581
    # Spezielle Suchen und Sumas

    public function sumaIsSelected($suma, $request)
    {
        if ($this->fokus === "angepasst") {
            if ($request->has($suma["name"])) {
                return true;
            }
        } else {
            $types = explode(",", $suma["type"]);
            if (in_array($this->fokus, $types)) {
                return true;
            }
        }
        return false;
    }

    public function actuallyCreateSearchEngines($enabledSearchengines, $siteSearchFailed)
    {
        $engines = [];
        foreach ($enabledSearchengines as $engine) {

            # Wenn diese Suchmaschine gar nicht eingeschaltet sein soll
            if (!$siteSearchFailed
                && strlen($this->site) > 0
                && (!isset($engine['hasSiteSearch'])
                    || $engine['hasSiteSearch']->__toString() === "0")) {
                continue;
            }

            # Setze Pfad zu Parser
            $path = "App\Models\parserSkripte\\" . ucfirst($engine["package"]->__toString());

            # Prüfe ob Parser vorhanden
            if (!file_exists(app_path() . "/Models/parserSkripte/" . ucfirst($engine["package"]->__toString()) . ".php")) {
582
                Log::error("Konnte " . $engine["name"] . " nicht abfragen, da kein Parser existiert");
583
                $this->errors[] = trans('metaGer.engines.noParser', ['engine' => $engine["name"]]);
584
585
586
587
588
589
590
591
                continue;
            }

            # Es wird versucht die Suchengine zu erstellen
            $time = microtime();
            try {
                $tmp = new $path($engine, $this);
            } catch (\ErrorException $e) {
592
                Log::error("Konnte " . $engine["name"] . " nicht abfragen. " . var_dump($e));
593
594
595
596
597
598
599
600
601
602
603
604
605
606
607
608
609
610
                continue;
            }

            # Ausgabe bei Debug-Modus
            if ($tmp->enabled && isset($this->debug)) {
                $this->warnings[] = $tmp->service . "   Connection_Time: " . $tmp->connection_time . "    Write_Time: " . $tmp->write_time . " Insgesamt:" . ((microtime() - $time) / 1000);
            }

            # Wenn die neu erstellte Engine eingeschaltet ist, wird sie der Liste hinzugefügt
            if ($tmp->isEnabled()) {
                $engines[] = $tmp;
            }
        }
        return $engines;
    }

    public function isBildersuche()
    {
611
        return $this->fokus === "bilder";
612
613
614
615
    }

    public function sumaIsAdsuche($suma, $overtureEnabled)
    {
616
        $sumaName = $suma["name"]->__toString();
617
        return
618
619
620
621
            $sumaName === "qualigo"
            || $sumaName === "similar_product_ads"
            || (!$overtureEnabled && $sumaName === "overtureAds")
            || $sumaName == "rlvproduct";
622
623
624
625
626
627
628
629
630
631
632
633
634
635
636
637
638
639
640
641
642
643
644
645
646
647
648
649
650
651
652
653
654
655
656
657
658
659
660
661
662
663
664
665
666
667
668
669
670
671
672
673
674
675
676
    }

    public function sumaIsDisabled($suma)
    {
        return
        isset($suma['disabled'])
        && $suma['disabled']->__toString() === "1";
    }

    public function sumaIsOverture($suma)
    {
        return
        $suma["name"]->__toString() === "overture"
        || $suma["name"]->__toString() === "overtureAds";
    }

    public function sumaIsNotAdsuche($suma)
    {
        return
        $suma["name"]->__toString() !== "qualigo"
        && $suma["name"]->__toString() !== "similar_product_ads"
        && $suma["name"]->__toString() !== "overtureAds";
    }

    public function requestIsCached($request)
    {
        return
        $request->has('next')
        && Cache::has($request->input('next'))
        && unserialize(Cache::get($request->input('next')))['page'] > 1;
    }

    public function getCachedEngines($request)
    {
        $next       = unserialize(Cache::get($request->input('next')));
        $this->page = $next['page'];
        $engines    = $next['engines'];
        if (isset($next['startForwards'])) {
            $this->startForwards = $next['startForwards'];
        }
        if (isset($next['startBackwards'])) {
            $this->startBackwards = $next['startBackwards'];
        }
        return $engines;
    }

    public function loadMiniSucher($xml, $subcollections)
    {
        $minisucherEngine             = $xml->xpath('suma[@name="minism"]')[0];
        $subcollections               = urlencode("(" . implode(" OR ", $subcollections) . ")");
        $minisucherEngine["formData"] = str_replace("<<SUBCOLLECTIONS>>", $subcollections, $minisucherEngine["formData"]);
        $minisucherEngine["formData"] = str_replace("<<COUNT>>", sizeof($subcollections) * 10, $minisucherEngine["formData"]);
        return $minisucherEngine;
    }

677
    # Passt den Suchfokus an, falls für einen Fokus genau alle vorhandenen Sumas eingeschaltet sind
678
679
    public function adjustFocus($sumas, $enabledSearchengines)
    {
680
681
        # Findet für alle Foki die enthaltenen Sumas
        $foki = []; # [fokus][suma] => [suma]
682
        foreach ($sumas as $suma) {
683
            if ((!$this->sumaIsDisabled($suma)) && (!isset($suma['userSelectable']) || $suma['userSelectable']->__toString() === "1")) {
684
                if (isset($suma['type'])) {
685
686
687
                    # Wenn foki für diese Suchmaschine angegeben sind
                    $focuses = explode(",", $suma['type']->__toString());
                    foreach ($focuses as $foc) {
688
689
690
691
692
                        if (isset($suma['minismCollection'])) {
                            $foki[$foc][] = "minism";
                        } else {
                            $foki[$foc][] = $suma['name']->__toString();
                        }
693
                    }
694
                } else {
695
                    # Wenn keine foki für diese Suchmaschine angegeben sind
696
697
698
699
700
                    if (isset($suma['minismCollection'])) {
                        $foki["andere"][] = "minism";
                    } else {
                        $foki["andere"][] = $suma['name']->__toString();
                    }
701
702
703
704
                }
            }
        }

705
        # Findet die Namen der aktuell eingeschalteten Sumas
706
        $realEngNames = [];
707
        foreach ($enabledSearchengines as $realEng) {
708
            $nam = $realEng["name"]->__toString();
709
            if ($nam !== "qualigo" && $nam !== "overtureAds" && $nam !== "rlvproduct") {
710
711
712
                $realEngNames[] = $nam;
            }
        }
713

714
        # Anschließend werden diese beiden Listen verglichen (jeweils eine der Fokuslisten für jeden Fokus), um herauszufinden ob sie vielleicht identisch sind. Ist dies der Fall, so hat der Nutzer anscheinend Suchmaschinen eines kompletten Fokus eingestellt. Der Fokus wird dementsprechend angepasst.
715
        foreach ($foki as $fok => $engines) {
716
            $isFokus      = true;
717
            $fokiEngNames = [];
718
            foreach ($engines as $eng) {
719
720
                $fokiEngNames[] = $eng;
            }
721
            # Jede eingeschaltete Engine ist für diesen Fokus geeignet
722
            foreach ($fokiEngNames as $fen) {
723
724
                # Bei Bildersuchen ist uns egal, ob alle Suchmaschinen aus dem Suchfokus eingeschaltet sind, da wir sie eh als Bildersuche anzeigen müssen
                if (!in_array($fen, $realEngNames) && $fok !== "bilder") {
725
726
727
                    $isFokus = false;
                }
            }
728
            # Jede im Fokus erwartete Engine ist auch eingeschaltet
729
730
            foreach ($realEngNames as $ren) {
                if (!in_array($ren, $fokiEngNames)) {
731
732
733
                    $isFokus = false;
                }
            }
734
            # Wenn die Listen identisch sind, setze den Fokus um
735
            if ($isFokus) {
736
737
738
                $this->fokus = $fok;
            }
        }
739
    }
740

741
742
743
744
745
746
747
    public function checkCanNotSitesearch($enabledSearchengines)
    {
        if (strlen($this->site) > 0) {
            $enginesWithSite = 0;
            foreach ($enabledSearchengines as $engine) {
                if (isset($engine['hasSiteSearch']) && $engine['hasSiteSearch']->__toString() === "1") {
                    $enginesWithSite++;
748
                }
749
750
            }
            if ($enginesWithSite === 0) {
751
                $this->errors[] = trans('metaGer.sitesearch.failed', ['site' => $this->site, 'searchLink' => $this->generateSearchLink("web", false)]);
752
753
                return true;
            } else {
754
                $this->warnings[] = trans('metaGer.sitesearch.success', ['site' => $this->site]);
755
                return false;
756
757
            }
        }
758
        return false;
759
760
761
762
    }

    public function waitForResults($enginesToLoad, $overtureEnabled, $canBreak)
    {
763
        $loadedEngines = 0;
764
        $timeStart     = microtime(true);
765
766
767
768

        # Auf wie viele Suchmaschinen warten wir?
        $engineCount = count($enginesToLoad);

769
770
        while (true) {
            $time          = (microtime(true) - $timeStart) * 1000;
771
            $loadedEngines = intval(Redis::hlen('search.' . $this->getHashCode()));
772
            if ($overtureEnabled && (Redis::hexists('search.' . $this->getHashCode(), 'overture') || Redis::hexists('search.' . $this->getHashCode(), 'overtureAds'))) {
773
                $canBreak = true;
774
            }
775
776

            # Abbruchbedingung
777
            if ($time < 500) {
778
                if (($engineCount === 0 || $loadedEngines >= $engineCount) && $canBreak) {
779
                    break;
780
781
782
                }

            } elseif ($time >= 500 && $time < $this->time) {
783
                if (($engineCount === 0 || ($loadedEngines / ($engineCount * 1.0)) >= 0.8) && $canBreak) {
784
                    break;
785
786
787
                }

            } else {
788
789
790
791
                break;
            }
            usleep(50000);
        }
792
793
794
795
796
797
798

        # Wir haben nun so lange wie möglich gewartet. Wir registrieren nun noch die Suchmaschinen, die geanwortet haben.
        $answered = Redis::hgetall('search.' . $this->getHashCode());
        foreach ($answered as $key => $value) {
            $enginesToLoad[$key] = true;
        }
        $this->enginesToLoad = $enginesToLoad;
799
    }
800

801
802
803
    public function retrieveResults($engines)
    {
        # Von geladenen Engines die Ergebnisse holen
804
805
806
        foreach ($engines as $engine) {
            if (!$engine->loaded) {
                try {
807
                    $engine->retrieveResults($this);
808
                } catch (\ErrorException $e) {
809
810
811
812
                    Log::error($e);
                }
            }
        }
813

814
        # Nicht fertige Engines verwefen
815
816
        foreach ($engines as $engine) {
            if (!$engine->loaded) {
817
                $engine->shutdown();
818
            }
819
820
821
        }

        $this->engines = $engines;
822
823
    }

824
825
826
/*
 * Ende Suchmaschinenerstellung und Ergebniserhalt
 */
Karl's avatar
Karl committed
827

828
829
    public function parseFormData(Request $request)
    {
830
        # Sichert, dass der request in UTF-8 formatiert ist
831
832
833
834
835
836
837
838
        if ($request->input('encoding', '') !== "utf8") {
            # In früheren Versionen, als es den Encoding Parameter noch nicht gab, wurden die Daten in ISO-8859-1 übertragen
            $input = $request->all();
            foreach ($input as $key => $value) {
                $input[$key] = mb_convert_encoding("$value", "UTF-8", "ISO-8859-1");
            }
            $request->replace($input);
        }
839
        $this->url = $request->url();
840
        # Zunächst überprüfen wir die eingegebenen Einstellungen:
841
        # Fokus
842
        $this->fokus = $request->input('focus', 'web');
843
        # Suma-File
844
        if (App::isLocale("en")) {
845
            $this->sumaFile = config_path() . "/sumas.xml";
846
        } else {
847
848
            $this->sumaFile = config_path() . "/sumas.xml";
        }
849
        if (!file_exists($this->sumaFile)) {
850
            die(trans('metaGer.formdata.cantLoad'));
851
        }
852
        # Sucheingabe
853
        $this->eingabe = trim($request->input('eingabe', ''));
854
        if (strlen($this->eingabe) === 0) {
855
            $this->warnings[] = trans('metaGer.formdata.noSearch');
856
857
        }
        $this->q = $this->eingabe;
858
        # IP
859
        $this->ip = $request->ip();
860
        # Language
861
        if (isset($_SERVER['HTTP_LANGUAGE'])) {
862
            $this->language = $_SERVER['HTTP_LANGUAGE'];
863
        } else {
864
865
866
867
            $this->language = "";
        }
        # Category
        $this->category = $request->input('category', '');
868
        # Request Times
869
870
        $this->time = $request->input('time', 1000);
        # Page
871
        $this->page = 1;
872
873
        # Lang
        $this->lang = $request->input('lang', 'all');
874
875
        if ($this->lang !== "de" && $this->lang !== "en" && $this->lang !== "all") {
            $this->lang = "all";
876
        }
877
        $this->agent  = new Agent();
878
        $this->mobile = $this->agent->isMobile();
879
        # Sprüche
880
881
        $this->sprueche = $request->input('sprueche', 'on');
        if ($this->sprueche === "on") {
882
            $this->sprueche = true;
883
        } else {
884
            $this->sprueche = false;
885
        }
Phil Höfer's avatar
Phil Höfer committed
886
        $this->maps = $request->input('maps', 'off');
887
        if ($this->maps === "on") {
888
889
890
891
            $this->maps = true;
        } else {
            $this->maps = false;
        }
892
        $this->newtab = $request->input('newtab', 'on');
893
894
895
896
897
        if ($this->newtab === "on") {
            $this->newtab = "_blank";
        } else {
            $this->newtab = "_self";
        }
898
        # Theme
Phil Höfer's avatar
Phil Höfer committed
899
        $this->theme = preg_replace("/[^[:alnum:][:space:]]/u", '', $request->input('theme', 'default'));
900
901
902
        # Ergebnisse pro Seite:
        $this->resultCount = $request->input('resultCount', '20');
        # Manchmal müssen wir Parameter anpassen um den Sucheinstellungen gerecht zu werden:
903
904
        if ($request->has('dart')) {
            $this->time       = 10000;
905
            $this->warnings[] = trans('metaGer.formdata.dartEurope');
906
        }
907
908
        if ($this->time <= 500 || $this->time > 20000) {
            $this->time = 1000;
909
        }
910
911
912
913
914
915
916
917
918
        if ($request->has('minism') && ($request->has('fportal') || $request->has('harvest'))) {
            $input    = $request->all();
            $newInput = [];
            foreach ($input as $key => $value) {
                if ($key !== "fportal" && $key !== "harvest") {
                    $newInput[$key] = $value;
                }
            }
            $request->replace($newInput);
919
        }
920
921
        if (App::isLocale("en")) {
            $this->sprueche = "off";
922
        }
923
924
        if ($this->resultCount <= 0 || $this->resultCount > 200) {
            $this->resultCount = 1000;
925
        }
926
927
928
929
930
        if ($request->has('onenewspageAll') || $request->has('onenewspageGermanyAll')) {
            $this->time  = 5000;
            $this->cache = "cache";
        }
        if ($request->has('password')) {
931
            $this->password = $request->input('password');
932
933
        }
        if ($request->has('quicktips')) {
934
            $this->quicktips = false;
935
        } else {
936
            $this->quicktips = true;
937
        }
938
        $this->out = $request->input('out', "html");
939
        # Standard output format html
940
        if ($this->out !== "html" && $this->out !== "json" && $this->out !== "results" && $this->out !== "results-with-style") {
941
            $this->out = "html";
942
        }
943
        $this->request = $request;
944
945
946
947
    }

    public function checkSpecialSearches(Request $request)
    {
948
949
950
951
952
        if ($request->has('site')) {
            $site = $request->input('site');
        } else {
            $site = "";
        }
953

954
955
956
957
        $this->searchCheckSitesearch($site);
        $this->searchCheckHostBlacklist();
        $this->searchCheckDomainBlacklist();
        $this->searchCheckPhrase();
Karl's avatar
Karl committed
958
        $this->searchCheckStopwords();
959
960
961
962

        if ($this->q === "") {
            $this->warnings[] = trans('metaGer.formdata.noSearch');
        }
963
964
    }

965
    public function searchCheckSitesearch($site)
966
    {
967
        if (preg_match("/(.*)\bsite:(\S+)(.*)/si", $this->q, $match)) {
968
969
970
            $this->site = $match[2];
            $this->q    = $match[1] . $match[3];
        }
971
972
        if ($site !== "") {
            $this->site = $site;
973
        }
974
    }
975

976
    public function searchCheckHostBlacklist()
977
    {
978
        while (preg_match("/(.*)(^|\s)-host:(\S+)(.*)/si", $this->q, $match)) {
979
            $this->hostBlacklist[] = $match[3];
980
            $this->q               = $match[1] . $match[4];
981
982
983
984
985
986
987
        }
        if (sizeof($this->hostBlacklist) > 0) {
            $hostString = "";
            foreach ($this->hostBlacklist as $host) {
                $hostString .= $host . ", ";
            }
            $hostString       = rtrim($hostString, ", ");
988
            $this->warnings[] = trans('metaGer.formdata.hostBlacklist', ['host' => $hostString]);
989
        }
990
    }
991

992
    public function searchCheckDomainBlacklist()
993
    {
994
        while (preg_match("/(.*)(^|\s)-domain:(\S+)(.*)/si", $this->q, $match)) {
995
            $this->domainBlacklist[] = $match[3];
996
            $this->q                 = $match[1] . $match[4];
997
998
999
1000
1001
1002
1003
        }
        if (sizeof($this->domainBlacklist) > 0) {
            $domainString = "";
            foreach ($this->domainBlacklist as $domain) {
                $domainString .= $domain . ", ";
            }
            $domainString     = rtrim($domainString, ", ");
1004
            $this->warnings[] = trans('metaGer.formdata.domainBlacklist', ['domain' => $domainString]);
1005
        }
1006
    }
1007

1008
    public function searchCheckStopwords()
1009
    {
1010
        while (preg_match("/(.*)(^|\s)-(\S+)(.*)/si", $this->q, $match)) {
1011
            $this->stopWords[] = $match[3];
1012
            $this->q           = $match[1] . $match[4];