[مسابقة Web Scraping] - [التحدي رقم 2]

تم تحميل الصفحة في 1,5061838 ثانية
[مسابقة Web Scraping] - [التحدي رقم 2]
الحالة
مغلق و غير مفتوح للمزيد من الردود.

dikart7

Active DeveloPer
rankrankrank
إنضم
1 يونيو 2012
المشاركات
954
الإعجابات
681
النقاط
93
الإقامة
المغرب
الموقع يستعمل api github
الوصف التاني يمكن جابه من رابط الاصلي لموقع github بدون تعب
كود C#
ublic class Program
{
  public static void Main()
  {
    Findpackage("value");
  }
  public static void Findpackage(string input)
  {
    string page = new WebClient().DownloadString("https://www.npmjs.com/package/" + input);
    var description = new Regex(@"(?s)og:description.*?=""(.*?)""").Match(page).Groups[1].Value;
    string url = new Regex(@"href=""(https:\/\/github.com\/.*?)"">github.com").Match(page).Groups[1].Value;
    Console.WriteLine( description  );
    var tre = Regex.Match(new WebClient().DownloadString(url) ,@"(?s)max-width:100%;""><\/a><\/p>(.*?\.<)\/p>").Groups[1].Value;
    // Console.WriteLine( tre );
    var Finqx = Regex.Matches(tre,">(.*?)<");
  for(int i =0 ; i<Finqx.Count ;i++)
{
Console.Write("" + Finqx[i].Groups[1].Value.Replace("&lt;",""));
}

  }
}

 

مدمن برمجة

Web Scraping Professional
rankrankrank
إنضم
14 أغسطس 2010
المشاركات
929
الإعجابات
225
النقاط
43
دا اصعب من الى انت بتقوله
الوصف الطويل دا متحرك مش ثابت ودى هيا اللعنه كلها جرب كدا مثلا ابحث عن value
واعرض المصدر
ثم ابحث عن var
واعرض المصدر
هتلاقى ان فى اختلاف شبه كلى فى منطقه الوصف الطويل
وهيا دى اى تعتبر التحدى اساسا
لا والله شفت المسألة من امس
وحلها بسيط جدا
طبعا حلها بلغة python مثلا
راح اعتمد على مكتبة bs4
وبعد جلب كامل المحتوى
راح يتم التصفيه بحسب المطلوب بحسب التعابير القياسية regex
المسألة بالنسبة لي بالبايثون متاكد انها بسيطة
وحللت ماهو اصعب منها بمراحل

لكن كما اخبرت .NET
مازلت متعلم الى الأن ثالث يوم لي فيها

فقط مجرد ماأن ابدأ باتقانها بالكامل خلال الاسبوع هذا باذن الله

سترى العجب

الان اتعلم جميع وظائف المكتبات او الاغلب هي الاهم بالنسبة لي

والايام بيننا ايها المبدع
والله دخولي لعالم السي شارب بالتحديد وليس vb.net
فقط من اجلك انت شخصيا
فقط احتاج الى اسبوع واحد فقط لاحترافها بالكامل بحول الله وقدرته
*_*
 

[ZeR0]

Web Scraping Professional
rankrankrank
إنضم
26 مارس 2013
المشاركات
601
الإعجابات
704
النقاط
93
العمر
27
الإقامة
egYpt
لا والله شفت المسألة من امس
وحلها بسيط جدا
طبعا حلها بلغة python مثلا
راح اعتمد على مكتبة bs4
وبعد جلب كامل المحتوى
راح يتم التصفيه بحسب المطلوب بحسب التعابير القياسية regex
المسألة بالنسبة لي بالبايثون متاكد انها بسيطة
وحللت ماهو اصعب منها بمراحل

لكن كما اخبرت .NET
مازلت متعلم الى الأن ثالث يوم لي فيها

فقط مجرد ماأن ابدأ باتقانها بالكامل خلال الاسبوع هذا باذن الله

سترى العجب

الان اتعلم جميع وظائف المكتبات او الاغلب هي الاهم بالنسبة لي

والايام بيننا ايها المبدع
والله دخولي لعالم السي شارب بالتحديد وليس vb.net
فقط من اجلك انت شخصيا
فقط احتاج الى اسبوع واحد فقط لاحترافها بالكامل بحول الله وقدرته
*_*
يا اخى الغالى الموضوع ملهوش دعوه باللغه عشان تفهمنى اكتر
افتح الموقع وابحث عن القيمه value
ثم قم بعرض مصدر الصفحه وظبط شغلك انك تجيب الوصف طويل منها
ثم قم مره اخرى بالبحث عن var
ستجد ان كل شى قد تغير وهكذا
يعني الى انت ظبطته على القيمه value
لو جيت تتطبقه على القيمه var
هيطلعلك نتائج مش متظبطه
دا الى اقصده
 

[ZeR0]

Web Scraping Professional
rankrankrank
إنضم
26 مارس 2013
المشاركات
601
الإعجابات
704
النقاط
93
العمر
27
الإقامة
egYpt
الموقع يستعمل api github
الوصف التاني يمكن جابه من رابط الاصلي لموقع github بدون تعب
كود C#
ublic class Program
{
  public static void Main()
  {
    Findpackage("value");
  }
  public static void Findpackage(string input)
  {
    string page = new WebClient().DownloadString("https://www.npmjs.com/package/" + input);
    var description = new Regex(@"(?s)og:description.*?=""(.*?)""").Match(page).Groups[1].Value;
    string url = new Regex(@"href=""(https:\/\/github.com\/.*?)"">github.com").Match(page).Groups[1].Value;
    Console.WriteLine( description  );
    var tre = Regex.Match(new WebClient().DownloadString(url) ,@"(?s)max-width:100%;""><\/a><\/p>(.*?\.<)\/p>").Groups[1].Value;
    // Console.WriteLine( tre );
    var Finqx = Regex.Matches(tre,">(.*?)<");
  for(int i =0 ; i<Finqx.Count ;i++)
{
Console.Write("" + Finqx[i].Groups[1].Value.Replace("&lt;",""));
}

  }
}

فكره ممتازه تفكير مبدع
بس فى حاجه يا حب ان تقريبا فى بعد القيم لما بتبحث عنها الوصف الطويل بتاعها مش بيكون مقتبس من github
 
الحالة
مغلق و غير مفتوح للمزيد من الردود.

الأعضاء النشطين حاليآ الذين يشاهدون هذا الموضوع (1 عضو و 0 ضيف)

خيارات الاستايل

نوع الخط
مودك
اخفاء السايدر بار OFF
توسيط المنتدى OFF
فصل الأقسام OFF
الأقسام الفرعية OFF
عرض المشاركات
حجم الخط
معلومات العضو OFF
إخفاء التوقيع OFF

إرجاع خيارات الإستايل