logo NodeSeekbeta

闲来无事,弄了下热度排名

闲来无事,抓取了一下前6页的帖子(300个),弄了下热度排名


标题 链接 浏览量 评论数 类别 热度
【已合入官方,使用官方脚本升级面板版本即可】哪吒面板+自定义主题+默认主题+历史tcpping食用教程 链接 27286 407 技术 19222.0
【推荐阅读】功能上线,赚鸡腿最快的方式来了 链接 14433 274 Dev 10185.0
[教程]手把手教你安装哪吒探针 链接 11270 95 技术 7917.0
【流媒体检测】小改版流媒体解锁检测脚本——增加DNS/原生解锁检测机制【更新记录见置顶评论】 链接 8378 151 技术 5910.0
【不知道是不是被骗】论坛找人大额买U 链接 7631 154 日常 5388.0
130代开TG会员,主打不上号! 链接 3728 84 交易 2635.0
自荐一个 tg 转发机器人,避免存入 tg 收藏夹吃灰,也是一个利用网页记事本的例子 链接 3259 31 技术 2291.0
[彭于晏の称赞]电信用阿里香港真是无敌1 链接 3155 134 日常 2249.0
游戏加速教程。网上有很多方案。看看我这一款。 链接 2179 46 技术 1539.0
【10辆车】IPLC专线5M小口子 【轩辕开车,从不翻车】 链接 2168 60 拼车 1536.0
Chatgpt-next-web使用aurora项目- 实现免费GPT3.5 API 链接 2071 45 技术 1463.0
Realit 被别人偷跑了1.8T流量 链接 1603 41 日常 1134.0
【极简备份教程】1分钟快速部署每日备份VPS重要数据至阿里云盘 链接 1579 47 技术 1119.0
人多力量大,大家一起刷1 链接 1525 27 日常 1076.0
瓦工太贵来拼车吧1 链接 1455 55 拼车 1035.0
aws吃码后4小时账号被封 链接 1271 58 日常 907.0
小鸡房搭建完毕,开撸1 链接 1264 41 日常 897.0
出租双不限附卡1g速率 链接 1150 32 交易 815.0
有什么三网直连,高峰期较为稳定的日本机? 链接 1129 42 交易 803.0
【合租车】IEPL专线300M 链接 1124 21 拼车 793.0
[彭于晏の蕉流]如何看邻居都在下什么片1 链接 1106 48 日常 789.0
【羊毛】Trading212轻松拿至多100英镑羊毛!有虚拟卡! 链接 1099 52 情报 785.0
免费轻松拿trading212¥600+开户股票教程 链接 1067 42 情报 760.0
阿里云盘收割!【首发】 链接 1041 26 情报 736.0
一年150块的三台小🐔 链接 1029 45 交易 734.0
写了个 Telegram Bot,可以实时翻译用户在Telegram中发送的消息,支持OpenAI和DeepL 链接 1019 41 技术 726.0
【哪吒监控】樱花粉主题 链接 1016 42 技术 724.0
Voll三网CMI机器合租,暂定10块300G 双1 链接 1015 28 拼车 719.0
手把手一步一步例解甲骨文扩区流程 链接 991 25 日常 701.0
阴阳人急了,挑逗一下,高潮了,哈哈哈4 链接 975 40 交易 694.0
【合租车】IPLC专线100M 【轩辕开车,从不翻车】 链接 976 19 拼车 689.0
Shiro - 一个极简主义的个人网站,体现了纸的纯净和雪的清新 链接 948 29 日常 672.0
NodeSeek首个由坛友搭建的免登陆快传服务上线 链接 912 43 技术 651.0
大家手里都几只🐔,平均每月都多少钱 链接 850 40 日常 607.0
Gmail好久不上,给我封了 链接 844 52 日常 606.0
新顶级域名注册局倒闭了,带着小姨子跑路了。 链接 854 24 曝光 605.0
蛋疼 Netcup RS1000 被限速了 链接 835 41 日常 597.0
代开TG会员 100/年不上号 链接 837 33 交易 596.0
甲骨文毕业了,撒花! 链接 825 24 日常 585.0
[支持闲鱼]天价!出个域名188188.xyz 链接 814 26 交易 578.0
[T楼] 送1个域名 链接 763 139 日常 576.0
关于买卖U的瓜 链接 799 32 日常 569.0
[分享]一键脚本-帮小鸡安装常用软件与环境(oh-my-zsh, omz-plugins, fd, bat, lsd,等) 链接 776 15 技术 548.0
纠结中 一直没想到答案 到底买什么鸡 链接 739 50 日常 532.0
1Panel让我用上了宝塔专业版 链接 748 22 技术 530.0
客服说,低配机器不能用debian 链接 743 29 日常 529.0
推推软路由?小型的那种 链接 733 44 日常 526.0
只有拿出【王炸域名】:【VPS.MG】【VPS美国】了,限时499元! 链接 729 30 交易 519.0
溢价收RN 黑五/闪购款Racknerd 1 8 11 14 链接 713 37 交易 510.0
剩余价值5折出MegaLayer的美国家宽1 链接 713 25 交易 507.0
12
  • 刷x刷到一个控制浏览器的自动化工具 DrissionPage,感觉很不错,现学现卖,哈哈

    DrissionPage自动跳过cf验证 xhj011

    优化下可以弄个定时发布的

    下面是源码:

    from DrissionPage import ChromiumPage
    
    def get_post_data(page:ChromiumPage, url:str) -> list:
        page.get(url)
        post_list = page.eles('.post-list-item')
        datas = []
    
        for post in post_list:
            # 获取标题和链接
            header = post.ele(".post-title")
            title = header.text
            href = header.child().attr("href")
    
            # 获取浏览量和评论数
            post_views_count = post.ele('.info-item info-views').text
            post_comments_count = post.ele('.info-item info-comments-count').text
    
            # 获取分类
            categories = post.ele('.info-item post-category').text
    
            data ={
                "title": title,
                "href": href,
                "views_count": int(post_views_count),
                "comments_count": int(post_comments_count),
                "categories": categories,
                "score": int(0.7 * int(post_views_count) + 0.3 * int(post_comments_count))
            }
            datas.append(data)
        
        return datas
    
    
    def get_score(post:dict):
        # 这里可以根据你的需求计算热度得分,比如浏览量和评论数量的加权得分
        return post["score"]
    
    def main():
        page = ChromiumPage()
        
        all_datas = []
        # 抓取前6页的数据, 共300个数据,可以修改页数
        for i in range(1,7):
            url = f"https://www.nodeseek.com/page-{i}"
            datas = get_post_data(page, url)
            all_datas = all_datas + datas
            print(f"第{i}页抓取完毕")
        # 按热度排序
        print("排序中")
        sorted_data = sorted(all_datas[2:], key=get_score, reverse=True)
    
        # 取前50个
        print("排序完成")
        print("生成表格中")
        # 生成 Markdown 表头
        markdown_str = "闲来无事,抓取了一下前6页的帖子(300个),弄了下热度排名 \n"
        markdown_str += "| 标题 | 链接 | 浏览量 | 评论数 | 类别 | 热度 |\n"
        markdown_str += "|------|------|--------|-------|------|------|\n"
    
        # 生成 Markdown 表格内容
        for post in sorted_data[:50]:
            title = post['title']
            href = post['href']
            views_count = post['views_count']
            comments_count = post['comments_count']
            categories = post['categories']
            score = post['score']
    
            row = "| {} | [链接]({}) | {} | {} | {} | {} |\n".format(title, href, views_count, comments_count, categories, score)
            markdown_str += row
    
        print(markdown_str)
        page.quit()
    
    if __name__ == "__main__":
        main()
    
    
  • @calg #9 支持,还想看看怎么算的score,发现被隐去了,感觉还是点赞和收藏权重更高一些,貌似这个没有体现 xhj003

  • @xy #10 score算法:0.7 * (post_views_count) + 0.3 * (post_comments_count)

    我只抓取了主页的信息,没有抓点赞和收藏。感谢提供了非常棒的思路,点赞和收藏的权重确实应该更高一些

  • xhj003

  • 如何看邻居都在下什么片 这标题起得好 不怕没热度

  • 技术流,给个鸡腿

  • 牛的,有没有api

  • 可惜我的天价域名没有上榜啊

  • @楼主 #5 上榜了啊,我有点印象,热度578.0,排名靠后点

12

你好啊,陌生人!

我的朋友,看起来你是新来的,如果想参与到讨论中,点击下面的按钮!

📈用户数目📈

目前论坛共有15342位seeker

🎉欢迎新用户🎉